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内 容 简 介 


本 书 较 系统 全 面 地 阐述 了 数据 库 系统 的 基础 理论 .基本 关系 和 基本 方法 ,全 书 共 分 10 章 。 具 体内 容 
包括 数据 库 的 基本 概念 ,关系 数据 库 、 关 系数 据 库 标准 语言 SQL、 关 系 模式 的 规范 化 理论 .数据库 设计 、 数 
据 库 安全 性 数据 库 完整 性 ,数据 库 故障 与 恢复 、 并 发 控制 理论 及 实践 篇 。 

本 书 是 作者 多 年 从 事 数据 库 原理 课程 教学 与 科研 实践 的 结晶 , 书 中 注重 基础 理论 的 介绍 ,并 在 理论 阐 
述 的 基础 上 和 具体 应 用 相 结 合 ,以 达到 整体 理论 教学 与 实践 教学 课程 体系 的 预期 教学 效果 。 本 书 删 减 烦 
琐 、 陈 旧 的 内 容 , 例 题 大 部 分 有 详细 的 解析 过 程 , 利 于 读者 对 理论 知识 的 吸收 和 巩固 。 

本 书 既 可 以 作为 高 等 院 校 计算 机 科学 与 技术 软件 工程 电子 信息 科学 .信息 安全 ,信息 管 理 与 信息 系 
统 、 信 息 与 计算 科学 等 专业 本 科 生 数 据 库 课程 的 教材 ,还 可 以 供 从 事 信息 领域 工作 的 科技 人 员 及 其 他 人 员 
参阅 。 

书 中 与 SQL 语句 相关 的 例题 均 在 SQL Server 2014 环境 下 测试 通过 。 


本 书 封面 贴 有 清华 大 学 出 版 社 防伪 标签 ,无 标签 者 不 得 销售 。 
版 权 所 有 ,侵权 必 究 。 侵 权 举报 电话 : 010-62782989 ”13701121933 


图 书 在 版 编目 (CIP) 数 据 


数据 库 原理 及 应 用 教程 : SQL Server 2014/ 沈 红 , 张 焕 君 主编 . 一 北京 : 清华 大 学 出 版 社 ,2018 
(21 世纪 高 等 学 校 计算 机 教育 实用 规划 教材 ) 
ISBN 978-7-302-51332-2 


I. @ 数 … 工 . @ 沈 … @ 张 … 于 . 关系 数据 库 系统 一 教材 NN. DTP311.132.3 


中 国 版 本 图 书馆 CIP 数据 核 字 (2018) 第 223734 号 


责任 编辑 : 页 斌 
封面 设计 : 常 雪 影 
责任 校对 : 焦 丽 丽 
责任 印 制 : 李 红 英 


出 版 发 行 : 清华 大 学 出 版 社 
网 址 : http://www. tup. com. cn, http://www. wqbook. com 
地 址 : 北京 清华 大 学 学 研 大 厦 A 座 邮 编 : 100084 
社 总 机 : 010-62770175 邮 ” 购 : 010-62786544 
投稿 与 读者 服务 : 010-62776969，c-service@tup. tsinghua. edu. cn 
质量 反馈 : 010-62772015 zhiliang@tup. tsinghua. edu. cn 
课件 下 载 : http://www. tup. com. cn,010-62795954 


印 装 者 : 三 河 市 铭 诚 印 务 有 限 公司 

经 销 : 全 国 新 华 书店 

开 本 : 185mmX260mm 印 张 : 20.75 字 数 : 505 千 字 

版 ”次 : 2018 年 7 月 第 1 版 印 ”次 : 2018 年 7 月 第 1 次 印刷 
印 数 : 1 一 1500 

定 价 : 49. 00 元 


产品 编号 : 080055-01 


随 着 我 国 高 等 教育 规模 的 扩大 以 及 产业 结构 调整 的 进一步 完善 ,社会 对 高 层次 应 用 型 
人 才 的 需求 将 更 加 迫切 。 各 地 高 校 紧密 结合 地 方 经 济 建设 发 展 需 要 ,科学 运用 市 场 调节 机 
制 , 合 理 调整 和 配置 教育 资源 ,在 改革 和 改造 传统 学 科 专 业 的 基础 上 ,加 强 工程 型 和 应 用 型 
学 科 专 业 建 设 ,积极 设置 主要 面向 地 方 支柱 产业 、 高 新 技术 产业 、 服 务 业 的 工程 型 和 应 用 型 
学 科 专业 ,积极 为 地 方 经 济 建设 输送 各 类 应 用 型 人 才 。 各 高 校 加 大 了 使 用 信息 科学 等 现代 
科学 技术 提升 \ 改 造 传统 学 科 专 业 的 力度 ,从 而 实现 传统 学 科 专业 向 工程 型 和 应 用 型 学 科 专 
业 的 发 展 与 转变 。 在 发 挥 传统 学 科 专业 师资 力量 强 、 办 学 经 验 丰富 、 教 学 资源 充裕 等 优势 的 
同时 ,不 断 更 新 教学 内 容 、 改 革 课 程 体系 ,使 工程 型 和 应 用 型 学 科 专 业 教 育 与 经 济 建设 相 适 
应 。 计 算 机 课程 教学 在 从 传统 学 科 向 工程 型 和 应 用 型 学 科 转 变 中 起 着 至 关 重要 的 作用 , 工 
程 型 和 应 用 型 学 科 专业 中 的 计算 机 课程 设置 .内容 体系 和 教学 手段 及 方法 等 也 具有 不 同 于 
传统 学 科 的 鲜明 特点 。 

为 了 配合 高 校 工程 型 和 应 用 型 学 科 专业 的 建设 和 发 展 ,急需 出 版 一 批 内 容 新 .体系 新 、 
方法 新 .手段 新 的 高 水 平 计算 机 课程 教材 。 目 前 ,工程 型 和 应 用 型 学 科 专业 计算 机 课程 教材 
的 建设 工作 仍 滞后 于 教学 改革 的 实践 ,如 现 有 的 计算 机 教材 中 有 不 少 内 容 陈旧 (依然 用 传统 
专业 计算 机 教材 代替 工程 型 和 应 用 型 学 科 专 业 教材 ), 重 理论 、 轻 实践 ,不 能 满足 新 的 教学 计 
划 、 课 程 设 置 的 需要 ; 一 些 课程 的 教材 可 供 选 择 的 品种 太 少 ; 一 些 基础 课 的 教材 虽然 品种 
较 多 ,但 低 水 平 重复 严重 ; 有 些 教材 内 容 庞杂 , 书 越 编 越 厚 ; 专业 课 教材 、 教 学 辅助 教材 及 
教学 参考 书 短缺 ,等 等 ,都 不 利于 学 生 能 力 的 提高 和 素质 的 培养 。 为 此 ,在 教育 部 相关 教学 
指导 委员 会 专家 的 指导 和 建议 下 ,清华 大 学 出 版 社 组 织 出 版 本 系列 教材 ,以 满足 工程 型 和 应 
用 型 学 科 专 业 计 算 机 课程 教学 的 需要 。 本 系列 教材 在 规划 过 程 中 体现 了 如 下 一 些 基本 原则 

(1) 面向 工程 型 与 应 用 型 学 科 专 业 ,强调 计算 机 在 各 专业 中 的 应 用 。 教 材 内 容 坚持 基 
本 理论 适度 ,反映 基本 理论 和 原理 的 综合 应 用 ,强调 实践 和 应 用 环节 。 

(2) 反映 教学 需要 ,促进 教学 发 展 。 教 材 规划 以 新 的 工程 型 和 应 用 型 专业 目录 为 依据 。 
教材 要 适应 多 样 化 的 教学 需要 ,正确 把 握 教 学 内 容 和 课程 体系 的 改革 方向 ,在 选择 教材 内 容 
和 编写 体系 时 注意 体现 素质 教育 、 创 新 能 力 与 实践 能 力 的 培养 ,为 学 生 知识 、 能 力 、 素 质 协 调 
发 展 创造 条 件 。 

(3) 实施 精品 战略 ,突出 重点 ,保证 质量 。 规 划 教 材 建设 仍然 把 重点 放 在 公共 基础 课 和 
专业 基础 课 的 教材 建设 上 ; 特别 注意 选择 并 安排 一 部 分 原来 基础 比较 好 的 优秀 教材 或 讲义 
修订 再 版 ,逐步 形成 精品 教材 ; 提倡 并 鼓励 编写 体现 工程 型 和 应 用 型 专业 教学 内 容 和 课程 
体系 改革 成 果 的 教材 。 
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(4) 主张 一 纲 多 本 ,合理 配套 。 基 础 课 和 专业 基础 课 教材 要 配套 ,同一 门 课程 可 以 有 多 
本 具有 不 同 内容 特 点 的 教材 。 处 理 好 教材 统一 性 与 多 样 化 ,基本 教材 与 辅助 教材 ,教学 参考 
书 ,文字 教材 与 软件 教材 的 关系 ,实现 教材 系列 资源 配套 。 

(5) 依靠 专家 ,择优 选用 。 在 制订 教材 规划 时 要 依靠 各 课程 专家 在 调查 研究 本 课程 教 
材 建 设 现状 的 基础 上 提出 规划 选 题 。 在 落实 主编 人 选 时 ,要 引入 竞争 机 制 , 通 过 申报 .评审 
确定 主编 。 书 稿 完成 后 要 认真 实行 审 稿 程序 ,确保 出 书 质量 。 

繁荣 教材 出 版 事业 ,提高 教材 质量 的 关键 是 教师 。 建 立 一 支 高 水 平 的 以 老 带 新 的 教材 
编写 队伍 才能 保证 教材 的 编写 质量 和 建设 力度 ,希望 有 志 于 教材 建设 的 教师 能 够 加 入 到 我 
们 的 编写 队伍 中 来 。 


21 世纪 高 等 学 校 计算 机 教育 实用 规划 教材 编 委 会 
联系 人 : 魏 江 江 weijj@tup. tsinghua. edu. cn 


数据 库 技术 是 计算 机 科学 技术 中 发 展 最 快 的 技术 之 一 ,已 在 社会 生活 中 得 到 广泛 的 应 
用 ,并 形成 一 个 巨大 的 软件 产业 。 它 已 成 为 计算 机 信息 系统 与 应 用 系统 的 核心 技术 和 重要 
基础 。 出 版 本 教材 是 为 了 反映 数据 库 学 科 的 新 成 果 和 应 用 的 新 方向 ,适应 数据 库 技术 的 不 
断 发 展 。 

本 书 既 注重 系统 地 介绍 数据 库 的 基本 理论 和 方法 ,又 补充 了 新 型 数据 库 系统 的 主要 技 
术 知 识 。 本 书 缩减 传统 数据 库 系 统 的 理论 部 分 内 容 , 突 出 数据 库 理论 与 应 用 技术 紧密 结合 
的 特点 ,结合 现代 的 软 、 硬 件 环境 及 应 用 实例 讲解 ,更 适 于 作为 高 等 学 校本 科 生 教材 。 

本 书 在 介绍 原理 知识 之 后 ,配合 有 大 量 的 相关 例题 ,加 深 读 者 对 理论 课 学 习 的 进一步 理 
解 。 大 部 分 的 例题 都 配 有 详细 的 解析 过 程 , 有 利于 读者 对 理论 知识 的 吸收 和 巩固 。 

书 中 每 章 后 面 均 配 有 适量 的 习题 ,以 加 强 读者 对 数据 库 系 统 概念 .方法 的 理解 和 掌握 。 

本 书 有 配套 的 课件 ,以 方便 教学 。 

本 书 共 分 10 章 ,结合 高 校 教 学 信息 管理 系统 数据 库 应 用 案例 ,较为 详细 地 介绍 了 数据 
库 系 统 的 基本 概念 ,原理 \ 方 法 和 应 用 技术 。 

第 1 章 介绍 数据 库 系统 的 相关 概念 ,回顾 数据 管理 技术 的 发 展 历史 ,并 在 此 基础 上 介绍 
数据 模型 的 概念 、 数 据 库 系统 结构 和 数据 库 系统 的 组 成 。 

第 2 章 介 绍 关系 数据 库 的 基本 概念 ,关系 模型 的 运算 理论 .关系 代数 及 关系 的 完整 性 等 
方面 的 知识 。 

第 3 章 介绍 关系 数据 库 标准 语言 SQL。 主 要 介绍 SQL 的 产生 发展, 特点 ,掌握 模式 、 
表 、 索 引 、 视 图 的 创建 与 管理 ,介绍 数据 库 中 数据 的 查询 与 更 新 操作 等 。 

第 4 章 介绍 关系 数据 理论 ,包括 函数 依赖 .公理 系统 ,规范化 和 模式 分 解 等 内 容 。 

第 5 章 介绍 关系 数据 库 设 计 理 论 ,在 结合 高 校 教学 信息 管理 系统 实例 的 基础 上 ,介绍 数 
据 库 设计 的 详细 步骤 ,包括 需求 分 析 、 概 念 结构 设计 、 修 辑 结 构 设 计 、 物 理 结构 设计 、 数 据 库 
实施 以 及 数据 库 运 行 和 维护 阶段 。 

第 6 章 介 绍 数据 库 安全 性 的 概念 以 及 数据 库 安全 控制 方法 。 

第 7 章 介 绍 数据 库 完整 性 的 概念 以 及 完整 性 的 维护 机 制 。 

第 8 章 介 绍 数据 库 故障 和 恢复 技术 ,包括 事务 的 概念 故障 的 种 类 及 恢复 策略 。 

第 9 章 介 绍 并 发 控制 ,首先 介绍 并 发 操作 对 数据 库 系统 带 来 的 影响 , 接 下 来 介绍 并 发 控 
制 概述 .封锁 的 概念 、 并 发 调度 的 可 串 行 性 两 段 锁 协 议 等 。 

第 10 章 介 绍 SQL Server 的 发 展 过 程 及 SQL Server 2014 的 安装 及 使 用 ,并 通过 一 个 
相关 实例 一 一 学 生 选 课 系 统 ,具体 介绍 数据 库 设 计 的 过 程 。 

本 书 既 着 眼 于 帮助 学 生 掌握 数据 库 系统 的 基本 原理 、 技 术 和 方法 ,又 助 其 了 解 现 代数 据 
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库 系统 的 特点 及 发 展 趋势 。 本 书 内 容 丰 富 , 叙 述 严谨 清晰 ,每 章 后 均 配 有 本 章 小 结 以 及 适量 
的 思考 题 和 习题 , 适 于 广大 师 生 的 教 与 学 。 

本 书 由 沈阳 理工 大 学 信息 学 院 沈 红 和 张 焕 君 负责 取材 、 组 织 和 统 稿 。 第 1 章 由 沈 红 、 张 
焕 君 共同 完成 ;第 2 章 、 第 3 章 由 沈 红 执笔 ;第 4 章 、 第 5 章 由 张 焕 君 执笔 ;第 6 章 、 第 7 章 由 
喻 红 婕 执笔 ;第 8 章 、 第 9 章 由 胡 树 杰 执 笔 ;第 10 章 由 喻 红 婕 . 胡 树 杰 和 李 爱 华 指导 完成 。 
实验 室 的 刘 雄 和 张 风 乔 两 位 学 生 负 责编 写 程序 ,在 诸位 教师 的 指导 下 验证 通过 。 特 别 是 刘 
雄 , 书 中 SQL 部 分 的 例题 都 由 他 通过 实验 验证 ,表示 感谢 ! 还 有 马 玉 峰 老师 、 崔 宁海 老师 、 
杨 大 为 老师 及 谨 净 老师 对 书稿 提出 了 宝贵 的 意见 并 对 文稿 做 了 最 后 的 校对 工作 。 在 此 感谢 
所 有 为 本 教材 出 版 做 出 贡献 的 老师 和 学 生 们 。 

本 书 在 编写 过 程 中 参考 了 一 些 书籍 及 文献 资料 ,在 此 并 向 被 引用 资料 的 作者 表示 感谢 。 

本 书 既 可 以 作为 高 等 院 校 计 算 机 科学 与 技术 、 软 件 工程 ,电子 信息 科学 、 信 息 安 全 ,信息 
管理 与 信息 系统 、 信 息 与 计算 科学 等 专业 本 科 生 的 数据 库 课 程 的 教材 ,还 可 以 供 从 事 信 息 领 
域 工作 的 科技 人 员 及 其 他 人 员 人 参阅 。 

在 本 书 的 编写 过 程 中 ,编者 尽 可 能 引入 新 的 技术 和 方法 ,力求 反映 当前 的 技术 水 平和 未 
来 的 发 展 方向 ,但 由 于 编者 水 平 有 限 , 书 中 难免 存在 不 足 之 处 , 敬 请 广大 读者 批评 指正 。 


编 者 
2018 年 3 月 
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第 1 章 绪 论 


【本 章 主要 内 容 】 

1. 简要 介绍 了 数据 库 系 统 的 基本 概念 及 数据 库 系 统 的 发 展 过 程 。 

2. 着 重 阐述 了 数据 模型 的 相关 理论 ,介绍 了 概念 模型 和 几 种 基本 数据 模型 。 
3. 重点 论述 了 三 级 模式 结构 。 

4. 简要 介绍 了 DBMS 的 功能 和 数据 库 系 统 的 组 成 。 


1.1 数据 库 系 统 概述 


数据 库 是 数据 管理 的 最 新 技术 ,是 计算 机 科学 的 重要 分 支 。 它 产生 于 20 世纪 60 年 代 ， 
到 现在 为 止 不 过 是 区 区 的 50 多 年 时 间 。 但 数据 库 的 研究 对 国民 经 济 和 人 类 的 社会 发 展 产 
生 了 巨大 的 影响 。 数 据 库 系统 ,也 就 是 本 书 将 要 讨论 的 主题 , 毫 无 疑问 是 软件 工程 领域 最 为 
耀眼 的 一 颗 明 星 。 数 据 库 目 前 作为 所 有 信息 系统 的 基础 , 正 改 变 着 许多 组 织 机 构 和 人 们 生 
活 的 方式 。 并 且 随 着 硬件 技术 的 显著 提高 和 通信 技术 的 快速 发 展 ,数据 库 技术 在 万 维 网 、 电 
子 商 务 ,移动 通信 和 网 格 计算 等 领域 已 经 越 来 越 凸 显 其 重要 性 。 

对 一 个 国家 来 说 ,数据 库 的 建设 规模 、 数 据 库 信息 量 的 大 小 和 对 数据 库 的 使 用 频 度 已 经 
成 为 衡量 该 国家 信息 化 程度 的 重要 标志 。 因 此 ,数据 库 不 仅 是 计算 机 专业 和 信息 管理 专业 
等 相关 学 科 的 重要 课程 ,也 是 许多 非 计算 机 专业 的 选修 课程 。 

那么 ,什么 是 数据 库 ? 什么 是 数据 库 系 统 ? 什么 是 数据 库 管理 系统 ? 数据 库 理论 与 技 
术 又 是 如 何 产生 和 发 展 起 来 的 呢 ? 这 是 本 节 将 要 介绍 的 内 容 。 

首先 介绍 几 个 最 常用 的 数据 库 术 语 。 


1.1.1 基本 概念 


1. 数据 与 信息 (Data& Information) 

数据 : 是 数据 库 中 存储 以 及 用 户 操纵 的 基本 对 象 。 数 据 是 描述 事物 的 符号 记录 。 说 到 
数据 ,可 能 人 大 脑 中 的 第 一 反应 是 数字 ,例如 0,1,2 等 。 其 实数 字 只 是 最 简单 的 数据 ,也 就 
是 说 ,数据 不 仅 是 数字 ,还 可 能 是 文本 、 图 形 、 图 像 音 频 、 视 频 、 人 事 档案 记录 ,银行 的 往来 账 
单 等 ,这 些 都 是 数据 。 

可 以 对 数据 定义 如 下 : 描述 事物 的 符号 记录 称 为 数据 。 描 述 事物 的 符号 可 以 是 数字 ， 
也 可 以 是 文字 、 图 形 .图 像 音频、 视频 .语言 等 ,数据 有 多 种 表现 形式 ,它们 都 可 以 经 过 数字 
化 后 存 人 计算 机 。 

但 是 数据 的 表现 形式 还 不 能 完全 表达 其 内 容 。 例 如 ,80 是 一 个 数据 ,可 以 是 一 个 人 的 
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体重 ,也 可 以 是 一 个 单位 的 人 数 , 还 可 以 是 一 个 学 生 某 科 的 成 绩 ……', 因 此 数据 需要 解释 , 才 
能 了 解 这 个 数据 的 具体 含义 。 数 据 和 关于 数据 的 解释 是 一 体 的 ,否则 单纯 的 数据 没有 意义 。 
数据 的 解释 是 指 对 数据 含义 的 说 明 ,数据 的 含义 称 为 数据 的 语义 ,数据 与 其 语义 是 密 不 可 
分 的 。 

信息 就 是 有 一 定 含义 的 、 经 过 加 工 处 理 的 、 对 决策 有 价值 的 数据 。 它 是 关于 现实 事物 存 
在 的 方式 或 运动 状态 的 反映 ,是 数据 及 数据 含义 的 总 和 。 

例如 描述 沈阳 理工 大 学 信息 学 院 新 生 信息 ,可 以 用 一 组 数据 * 张 三 同学 ,男生 ,1998 年 5 
月 生 ,2016 年 和 学 , 考 人 沈阳 理工 大 学 信息 学 院 的 计算 机 科学 与 应 用 专业 ”。 在 计算 机 中 可 
以 这 样 描述 : 


( 张 三 , 男 ,199805, 信 息 学 院 , 计算机 科学 与 应 用 ,2016) 


因此 数据 和 信息 可 以 归纳 为 : 数据 是 信息 的 载体 ,信息 是 数据 的 内 涵 ( 解 释 )。 即 数据 
是 信息 的 符号 表示 ,而 信息 通过 数据 描述 ,又 是 数据 语义 的 解释 。 尽 管 两 者 在 概念 上 不 尽 相 
同 , 但 通常 在 使 用 时 并 不 严格 区 分 。 

2. 数据 库 (DataBase, DB) 

数据 库 : 顾名思义 ,就 是 存放 数据 的 仓库 。 那 么 如 何 给 出 数据 库 的 严格 定义 呢 ? 

严格 地 讲 ,数据 库 是 按 一 定 结构 组 织 并 长 期 存储 在 计算 机 内 、 可 共享 的 大 量 数据 的 集 
合 。 数 据 库 中 的 数据 按 一 定 的 数据 模型 组 织 .描述 和 存储 ,具有 较 小 的 宛 余 度 、 较 高 的 数据 
独立 性 和 易 扩 展 性 ,并 可 为 各 种 用 户 共享 。 

概括 地 讲 , 数 据 库 中 的 数据 ,具有 永久 存储 、 有 组 织 和 可 共享 三 大 特点 。 

3. 数据 库 管 理 系统 (DataBase Management System.DBMS) 

在 了 解 了 数据 和 数据 库 基 本 概念 之 后 ,下 一 个 应 该 掌握 的 问题 就 是 数据 如 何 更 科学 地 
组 织 和 存储 在 数据 库 中 ,以 及 人 们 如 何 高 效 地 获取 和 维护 数据 库 中 的 数据 。 而 能 完成 这 些 
任务 的 是 一 个 系统 软件 一 一 数据 库 管 理 系统 。 

数据 库 管 理 系统 : 是 管理 和 维护 数据 库 的 系统 软件 , 它 位 于 用 户 与 操作 系统 之 间 , 是 数 
据 库 和 用 户 之 间 的 一 个 接口 。 其 主要 作用 是 在 数据 库 建立 、 运 行 和 维护 时 对 数据 库 进 行 统 
一 管理 和 控制 。 数 据 库 管理 系统 和 操作 系统 一 样 是 计算 机 的 基础 软件 ,也 是 一 个 大 型 复杂 
的 软件 系统 。 

概念 说 明 : 

(1) 从 操作 系统 角度 来 看 ,DBMS 是 使 用 者 , 它 建立 在 操作 系统 的 基础 之 上 ,需要 操作 
系统 提供 底层 服务 ,如 创建 进程 . 读 写 磁盘 文件 ,对 CPU 和 内 存 进行 管理 等 。 

(2) 从 数据 库 角度 来 看 ,DBMS 是 管理 者 .是 数据 库 系统 的 核心 ,是 为 数据 库 的 建立 、 使 
用 和 维护 而 配置 的 系统 软件 ,负责 对 数据 库 进 行 统一 的 管理 和 控制 。 

(3) 从 用 户 的 角度 来 看 ,DBMS 是 工具 和 桥梁 ,是 位 于 操作 系统 和 用 户 之 间 的 一 层 数据 
管理 软件 。 用 户 对 数据 库 发 出 的 所 有 操作 命令 ,都 要 通过 DBMS 来 执行 。 

那么 DBMS 主要 提供 的 功能 有 哪些 ? 

(1) 数据 定义 功能 。 

DBMS 提供 数据 定义 语言 (Data Definition Language, DDL) ,用 户 通 过 它 可 以 方便 地 对 


数据 库 中 的 数据 对 象 进行 定义 。 例 如 可 以 定义 模式 、 数 据 库 表 、 视 图 等 。 

(2) 数据 的 组 织 .存储 和 管理 。 

为 了 提高 存储 空间 利用 率 和 方便 数据 库 中 数据 存 取 和 查找 ,DBMS 要 分 类 组 织 、 存 储 
和 管理 数据 库 中 的 各 类 数据 ,包括 数据 字典 ,用户 数据 .数据 的 存 取 路 径 等 。 要 确定 以 何 种 
文件 结构 和 存 取 方式 在 存储 级 上 组 织 这 些 数据 ,如 何 实 现 数据 之 间 的 联系 。 数 据 组 织 和 存 
储 的 基本 目标 是 提高 存储 空间 利用 率 和 方便 存 取 ,因此 提供 多 种 存 取 方 法 (如 : 索引 查找 、 
Hash 查找 顺序 查找 等 ) 来 提高 存 取 效 率 。 

(3) 数据 操纵 功能 。 

DBMS 提供 数据 操纵 语言 (Data Manipulation Language,DML) 来 实现 对 数据 库 中 的 
数据 进行 操作 。 如 查询 ,插入 、 删 除 和 修改 等 , 即 通常 说 的 增 、 删 、 改 、 查 。 

(4) 数据 库 运行 管理 功能 。 

对 数据 库 中 的 数据 的 安全 性 、 完 整 性 、 并 发 控制 和 发 生 故 障 后 的 故障 恢复 等 方面 的 管理 
功能 。 

(5) 数据 库 的 建立 和 维护 功能 。 

数据 库 的 建立 和 维护 包括 对 数据 库 初始 数据 的 初始 装载 ,数据 转换 ,数据 转 储 、 数 据 恢 
复 .数据 重组 和 记录 日 志文 件 以 及 性 能 监视 .分 析 功能 等 。 

常用 的 DBMS 有 Oracle、DB2、SQL Server、SyBase、MySQL FoxPro 等 。 

4. 数据 库 系统 (DataBase System,.DBS) 

数据 库 系统 是 指 在 计算 机 系统 中 引入 数据 库 后 的 系统 , 故 可 以 简单 的 说 ,数据 库 系统 是 
具有 管理 数据 库 功能 的 计算 机 系统 。 可 以 简化 表示 为 : 

数据 库 系统 二 计算 机 系统 (硬件 十 软件 十 人 员 ) 十 数据 库 管理 系统 十 数据 库 

因此 ,一 般 数 据 库 系统 由 数据 库 、 数 据 库 管 理 系统 、 计 算 机 软件 ,硬件 支撑 环境 以 及 各 类 
人 员 ( 包 括 数据 库 管理 员 ,DataBase Administrator.DBA) 所 组 成 。 

数据 库 管理 系统 在 操作 系统 (OS) 支 持 下 ,对 数据 库 进 行 管理 与 维护 ,并 提供 用 户 对 数 
据 库 的 操作 接口 。 它 们 之 间 的 关系 如 图 1-1 所 示 。 


用 户 1 用 户 2 人 用 户 n 
应 用 软件 及 界面 
区 


操作 系统 


计算 机 
硬件 平台 数据 库 


1-1 数据库、 数据库 管理 系统 .数据 库 系 统 的 关系 


畦 论 
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在 一 般 不 引起 混淆 的 情况 下 常常 把 数据 库 系统 简称 为 数据 库 。 

5. 管理 信息 系统 (Management Information System.MIS) 

管理 信息 系统 是 计算 机 应 用 领域 的 重要 分 支 。 管 理 信息 系统 帮助 人 们 完成 原来 需要 手 
工 处 理 的 复杂 工作 , 它 不 仅 能 明显 地 提高 工作 效率 ,降低 劳动 强度 ,而 且 能 提高 信息 管理 的 
质量 和 管理 水 平 。 因 而 ,管理 信息 不 是 简单 地 模拟 手工 劳动 , 它 要 更 合理 地 组 织 数 据 ,更 科 
学 地 管理 数据 ,为 事务 发 展 提供 控制 信息 。 因 此 , 它 为 事务 变化 提供 关于 发 展 趋势 和 变化 规 
律 的 信息 。 以 数据 库 技术 为 基础 的 管理 信息 系统 是 运用 系统 管理 的 理论 和 方法 ,以 计算 机 
技术 数据 处 理 技术 和 网 络 通信 技术 为 工具 和 手段 ,具有 对 信息 进行 加 工 处 理 、 存 储 和 传递 
等 功能 ,同时 具有 预测 控制、 组 织 和 决策 等 功能 的 人 -机 系统 。 

管理 信息 系统 的 核心 是 数据 库 。 管 理 信息 系统 的 数据 存放 在 数据 库 中 ,数据 库 技术 为 
管理 信息 系统 提供 了 数据 管理 的 手段 ,数据 库 管理 系统 为 管理 信息 系统 提供 了 系统 设计 的 
方法 .工具 和 环境 。 


1.1.2 数据 库 管 理 系统 的 产生 和 发 展 


数据 库 技术 是 应 数据 管理 任务 的 需求 而 产生 的 。 数 据 管理 是 研究 如 何 对 数据 进行 分 
类 组织, 编码 ,存储 ,检索 和 维护 的 一 门 科学 ,是 数据 处 理 的 核心 技术 。 而 数据 处 理 是 指 对 
各 种 数据 进行 收集 、 存 储 、 分 类 、 加 工 和 传播 等 一 系列 活动 的 总 和 。 

随 着 计算 机 硬件 和 软件 的 发 展 ,数据 管理 经 历 了 人 工 管理 阶段 .文件 系统 阶段 ,数据 库 
系统 阶段 ,现在 正 向 新 一 代 的 更 高 级 的 数据 库 系统 发 展 。 下 面 简 单 介 绍 数据 管理 经 历 的 三 
个 初级 阶段 。 

1. 人 工 管理 阶段 

人 工 管理 阶段 (20 世纪 50 年 代 中 期 之 前 ) 是 计算 机 数据 管理 的 初级 阶段 。 当 时 计算 机 
主要 用 于 科学 计算 ,因此 需要 处 理 的 数据 量 小 。 从 硬件 看 ,当时 的 外 存 只 有 纸 带 、 卡 片 、 磁 
带 ,没有 直接 存 取 的 存储 设备 ,所 有 数据 不 能 存储 。 从 软件 看 , 那 时 还 没有 操作 系统 ,没有 管 
理 数据 的 软件 ,数据 处 理 方式 是 批 处 理 。 并 且 由 于 当时 没有 专门 的 软件 对 数据 进行 管理 , 程 
序 员 在 设计 程序 时 不 仅 要 规定 数据 的 逻辑 结构 ,而 且 还 要 设计 其 物理 结构 , 即 数据 的 存储 地 
址 、 存 取 方 法 、 输 入 输出 方式 等 ,这 样 使 得 程序 与 数据 之 间 依 赖 性 很 强 ,一 旦 数据 的 存储 地 
址 ,存储 方式 稍 有 改变 ,就 必须 修改 相应 的 程序 。 此 外 , 当 同 一 组 数据 面向 多 个 应 用 程序 时 ， 
由 于 用 户 各 自 定义 自己 的 数据 ,数据 彼此 之 间 不 能 共享 ,存在 大 量 的 数据 宛 余 。 

人 工 管理 阶段 的 数据 管理 具有 以 下 4 个 特点 。 

(1) 数据 不 保存 。 

人 工 管理 阶段 ,由 于 当时 计算 机 主要 用 于 科学 计算 ,其 管理 数据 系统 还 是 仿照 科学 计算 
的 模式 进行 设计 ,数据 管理 中 涉及 的 数据 基本 不 需要 也 不 允许 长 期 保存 。 当 时 的 处 理 方法 
是 在 需要 时 将 数据 输入 ,用 完 就 撤 走 。 不 仅 对 用 户 数据 这 样 处 理 , 对 系统 软件 有 时 也 是 这 样 
处 理 的 。 

(2) 由 应 用 程序 管理 数据 ,数据 与 程序 之 间 不 具有 相对 独立 性 。 

在 人 工 管理 阶段 ,由 于 没有 专门 的 软件 管理 数据 ,数据 需要 由 应 用 程序 自己 设计 、 说 明 
(定义 ) 和 管理 。 应 用 程序 中 不 仅 要 规定 数据 的 逻辑 结构 ,而 且 要 设计 物理 结构 ,包括 存储 结 
构 、 存 取 方 法 、 输 入 方式 等 。 这 就 造成 程序 中 存 取 数据 的 子 程序 随 着 数据 存储 机 制 的 改变 而 


改变 的 问题 ,使 数据 与 程序 之 间 不 具有 相对 独立 性 ,给 程序 的 设计 和 维护 带 来 了 一 定 的 
麻烦 。 

(3) 数据 不 共享 .元 余 度 大 。 

人 工 管理 阶段 的 数据 是 面向 应 用 的 ,一 组 数据 只 能 对 应 一 个 程序 ,即使 两 个 应 用 程序 涉 
及 某 些 相同 的 数据 ,也 必须 各 自 定义 ,无 法 互相 利 
用 、 互 相 参 照 。 所 以 程序 与 程序 之 间 有 大 量 的 元 余 
数据 。 应 用 程序 2 数据 集 2 | 

(4) 数据 不 具有 独立 性 。 

数据 的 逻辑 结构 或 物理 结构 发 生变 化 后 ,必须 ， 

对 应 用 程序 做 相应 的 修改 ,这 就 加 重 了 程序 员 的 应 用 程序 ”一 一 于 数据 集 n 
负担 。 

人 工 管理 阶段 应 用 程序 与 数据 之 间 的 一 一 对 应 
关系 可 用 图 1-2 所 示 。 

2. 文件 系统 阶段 

20 世纪 50 年 代 后 期 到 60 年 代 中 期 ,计算 机 在 软件 及 硬件 方面 都 有 了 极 大 的 发 展 。 随 
着 计算 机 应 用 领域 拓宽 ,计算 机 不 仅 用 于 科学 计算 ,还 大 量 用 于 数据 管理 。 这 个 阶段 的 数据 
管理 水 平 进入 到 文件 系统 阶段 。 这 时 在 硬件 方面 已 出 现 了 磁盘 、 磁 鼓 等 直接 存 取 存 储 设 备 ， 
可 以 用 来 存放 大 量 数据 ; 软件 方面 ,操作 系统 中 的 文件 系统 就 是 专门 用 来 管理 所 存储 数据 
的 软件 。 处 理 方式 上 不 仅 有 了 批 处 理 , 而 且 能 够 联机 实时 处 理 。 在 这 种 背景 下 ,数据 管理 的 
系统 规模 、 管 理 技术 和 水 平 都 有 了 较 大 幅度 的 发 展 。 尽 管 文件 管理 阶段 比 手工 管理 阶段 在 
数据 管理 手段 和 管理 方法 上 有 很 大 的 改进 ,但 文件 管理 方法 仍然 存在 着 许多 缺点 。 

文件 管理 阶段 的 数据 管理 特点 : 

(1) 管理 的 数据 以 文件 的 形式 长 久 地 被 保存 在 计算 机 的 外 存 中 。 

在 文件 管理 阶段 ,这 时 的 计算 机 不 仅 用 于 科学 计算 ,而 且 大 量 地 用 于 数据 处 理 。 如 果 总 
是 临时 性 地 输入 数据 ,根本 无 法 满足 用 户 的 使 用 要 求 , 工 作 会 极其 低 效 。 因 此 ,数据 必须 长 
期 保留 在 外 存 上 。 并 通过 对 数据 文件 的 存 取 实现 对 文件 的 查询 ,修改 、 插 入 和 删除 等 常见 的 
数据 操作 。 

(2) 文件 系统 有 专门 的 数据 管理 软件 提供 有 关 数 据 存 取 、 查 询 及 维护 功能 。 

在 文件 系统 中 ,由 专门 的 软件 即 文件 系统 进行 数据 管理 ,文件 系统 把 数据 组 织 成 相互 独 
立 的 数据 文件 ,实现 了 “ 按 名 存 取 ”, 即 按 文 件 名 访问 、 按 记录 进行 存 取 的 管理 技术 。 它 能 够 
为 程序 和 数据 之 间 提 供 存 取 方 法 ,可 以 对 文件 进行 修改 .插入 和 删除 的 操作 。 文 件 系统 实现 
了 记录 内 的 结构 性 ,但 整体 无 结构 。 程 序 和 数据 之 间 由 文件 系统 提供 存 取 方法 进行 转换 ,使 
应 用 程序 与 数据 之 间 有 了 一 定 的 独立 性 。 这 样 ,程序 员 在 设计 程序 时 可 以 把 精力 集中 到 算 
法 上 ,而 不 必 过 多 地 考虑 物理 细节 ,同时 数据 在 存储 上 的 改变 不 一 定 反 映 在 程序 上 ,使 程序 
的 设计 和 维护 工作 量 大 大 减 小 。 

但 是 ,文件 系统 仍然 有 以 下 的 不 足 之 处 。 

(1) 数据 的 共享 性 差 ,元 余 度 大 。 

由 于 文件 系统 采用 面向 应 用 的 设计 思想 ,系统 中 的 数据 文件 都 是 与 应 用 程序 相对 应 的 ， 
所 以 一 个 (或 一 组 ) 文 件 基本 上 对 应 于 一 个 应 用 程序 ,而 且 文 件 仍然 是 面向 应 用 的 。 当 不 同 
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图 1-2 人 工 管理 阶段 应 用 程序 与 
数据 之 间 的 对 应 关系 
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的 应 用 程序 具有 部 分 相同 的 数据 时 ,也 必须 建立 各 自 的 数据 文件 ,而 不 能 共享 相同 的 数据 ， 
因此 造成 了 数据 的 元 余 度 (Redundancy) 大 ,浪费 存储 空间 的 问题 。 

例如 : 某 一 学 校 学 生 处 管理 学 生 人 事 档 案 ,教务 处 管理 学 生 学 习 情 况 记录 ,所 用 到 的 学 
生 数 据 很 多 都 是 重复 的 。 相 同 的 数据 不 能 被 共享 ,必然 造成 数据 元 余 。 

(2) 数据 的 不 一 致 性 。 

由 于 相同 数据 的 重复 存储 、 各 自 管理 ,容易 造成 数据 的 不 一 致 性 ,给 数据 的 修改 和 维护 
带 来 了 困难 ,还 容易 造成 数据 不 一 致 的 恶果 。 

例如 : 如 果 学 生 处 修改 了 某 个 学 生 信息 ,而 教务 处 没有 修改 该 学 生 的 相应 信息 ,结果 造 
成 了 同一 学 生 信息 的 不 一 致 性 。 

(3) 数据 独立 性 差 。 

在 文件 系统 中 ,数据 文件 之 间 是 孤立 的 ,不 能 反映 现实 世界 中 事物 之 间 的 内 在 关系 ,使 
数据 之 间 的 联系 无 法 描述 。 并 且 每 一 个 数据 文件 服务 于 某 一 特定 应 用 ,因此 文件 的 逻辑 结 
构 对 该 应 用 程序 来 说 是 优化 的 ,因此 要 想 对 现 有 的 数据 再 增加 一 些 新 的 应 用 会 很 困难 ,应 用 
程序 系统 不 容易 扩充 。 文 件 与 应 用 程序 联系 密切 , 当 文 件 的 结构 发 生 改 变 时 ,必须 修改 相应 
的 应 用 程序 ,包括 修改 记录 结构 定义 和 应 用 程序 的 数据 处 理 部 分 。 此 外 ,如 果 应 用 程序 发 生 
改变 ,也 可 能 影响 文件 的 定义 。 

例如 : 应 用 程序 改 用 不 同 的 高 级 语言 编写 ,也 将 引起 文件 数据 结构 的 改变 。 因 此 数据 
与 程序 之 间 仍 缺乏 独立 性 。 可 见 ,文件 系统 仍然 是 一 个 不 具有 弹性 的 无 结构 的 数据 集合 , 即 
文件 之 间 是 孤立 的 ,不 能 反映 现实 世界 。 

(4) 数据 结构 化 程度 低 , 不 易 扩 展 新 的 应 用 。 

文件 系统 是 以 文件 .记录 和 数据 项 的 结构 组 织 数据 的 。 记 录 被 组 织 成 文件 ,记录 由 字段 
组 成 ,记录 内 部 有 了 一 定 的 结构 ,但 是 文件 之 间 是 孤立 的 ,从 整体 上 看 是 无 结构 的 ,没有 反映 
[xn | 现实 世界 事物 之 间 的 内 在 联系 ,因此 很 难 对 数据 进行 
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合理 的 组 织 , 以 适应 不 同 应 用 的 需要 。 在 一 个 应 用 系 
而 各 -|_| 统 中 不 增加 新 的 数据 文件 就 不 能 增加 新 的 应 用 ,不易 
于 扩展 新 的 应 用 。 
文件 系统 的 基本 数据 存 取 单位 是 记录 , 即 文件 系 
方法 : 统 按 记录 进行 读 写 操作 。 在 文件 系统 中 ,只 有 通过 对 
整 条 记录 的 读 取 操 作 , 才 能 获得 其 中 数据 项 (字段 ) 的 
应 用 程序 n 上 ----- 文件 组 n 信息 ,不 能 直接 对 记录 中 的 数据 项 (字段 ) 进 行 数据 存 
取 操 作 。 
加 el 文件 系统 阶段 应 用 程序 与 数据 之 间 的 对 应 关系 
可 用 图 1-3 所 示 。 
3. 数据 库 系 统 阶段 
数据 库 系统 是 在 文件 系统 基础 上 发 展 起 来 的 。 但 是 ,数据 库 系 统 与 文件 系统 具有 本 质 
上 的 区 别 。 


到 了 20 世纪 60 年 代 后 期 ,这 一 阶段 的 数据 管理 的 背景 是 : 计算 机 管理 的 对 象 和 应 用 
范围 越 来 越 广泛 ,数据 管理 的 规模 也 日 趋 增 大 ,同时 带 来 数据 量 的 急剧 增长 。 因 此 数据 共享 
的 要 求 也 越 来 越 强 烈 , 文 件 管理 系统 已 经 不 能 适应 需求 。 并 在 这 个 时 期 出 现 了 内 存 大 、 运 行 
速度 快 的 主机 和 大 容量 的 硬盘 ,计算 机 硬件 价格 下 降 而 软件 价格 上 升 ,为 编制 和 维护 系统 软 


件 及 应 用 程序 所 需 的 成 本 相对 增加 。 对 数据 库 系 统 的 研制 和 开发 来 说 ,这 种 背景 既 反 映 了 
迫切 的 市 场 需求 ,又 提供 了 有 利 的 开发 环境 。 
同时 多 种 应 用 、 多 种 语言 互相 覆盖 的 共享 数据 集合 的 要 求 越 来 越 强 烈 。 在 处 理 方式 上 ， 
联机 实时 处 理 要 求 更 多 ,并 开始 提出 和 考虑 分 布 处 理 。 在 这 种 背景 下 ,以 文件 系统 作为 数据 
管理 手段 显然 已 不 能 适应 需求 ,于 是 为 解决 多 用 户 、 多 应 用 共享 数据 的 需求 ,使 数据 为 尽 可 
能 多 的 应 用 服务 ,数据 库 技 术 便 应 运 而 生 , 并 出 现 了 统一 管理 数据 的 专门 软件 系统 一 一 数据 
库 管 理 系 统 。 
与 文件 系统 相 比 ,数据 库 系统 具有 很 多 优点 。 从 文件 系统 到 数据 库 系 统 , 标 志 着 数据 管 
理 技术 的 飞跃 。 下 面 详细 地 讨论 数据 库 系 统 的 特点 及 功能 。 
数据 库 系统 的 特点 如 下 。 
(1) 数据 结构 化 。 
数据 库 系统 与 文件 系统 的 本 质 区 别 是 数据 库 系统 实现 了 整体 数据 的 结构 化 。 通 过 之 前 
的 介绍 我 们 了 解 到 ,在 文件 系统 中 ,记录 被 组 织 成 记录 ,记录 由 字段 组 成 ,记录 内 部 有 了 一 定 
的 结构 ,但 是 文件 之 间 是 孤立 的 ,从 整体 上 看 是 无 结构 的 ,没有 反映 现实 世界 事物 之 间 的 内 
在 联系 ,因此 很 难 对 数据 进行 合理 的 组 织 以 适应 不 同 应 用 的 需要 。 数 据 结构 化 程度 低 , 在 一 
个 应 用 系统 中 不 增加 新 文件 就 不 能 增加 新 的 应 用 ,不 易于 扩展 新 的 应 用 。 
例如 ,学 生 文件 Student 的 记录 是 由 学 生 编 号 ,姓名 性别、 年 龄 .所 属 学 院 、 家 庭 住址 、 
联系 电话 等 属性 组 成 ,课程 文件 Course 和 学 生 选 课文 件 SC 的 结构 如 图 1-4 所 示 。 
学 生 文 件 Student 的 记录 结构 : 
学 号 | 姓名 | 性 别 | 年 龄 | 所 属 学 院 | 人 学 时 间 | 家 庭 住 址 | 联系 电话 
课程 文件 Course 的 记录 结构 : 
课程 号 | 课程 名 | 学 分 | 先 修 课 
学 生 选 课文 件 SC 的 记录 结构 : 
学 号 | 课程 号 | 成 绩 


图 1-4 _ 学生、 课程, 学 生 选 课文 件 结构 


在 上 例 中 ,学 生 文件 Student\ 课 程 文件 Course 和 学 生 选 课文 件 SC 是 独立 的 3 个 文件 ， 
但 在 现实 生活 中 ,这 3 个 文件 的 记录 之 间 是 有 联系 的 , 即 SC 的 学 号 必须 是 Student 文件 中 
某 个 学 生 的 学 号 ,SC 的 课程 号 必须 是 Course 文件 中 某 门 课程 的 编号 。 而 在 文件 系统 中 不 
能 直接 反映 出 文件 之 间 的 这 些 联系 。 

数据 库 设计 的 基础 是 数据 模型 。 在 进行 数据 库 设 计时 ,首先 要 站 在 全 局 的 角度 抽象 和 
组 织 数据 ; 要 完整 准确 地 描述 数据 自身 和 数据 之 间 联 系 的 情况 ,要 建立 适合 整体 需要 的 数 
据 模型 。 数 据 库 系 统 是 以 数据 库 为 基础 的 ,各 种 应 用 程序 应 建立 在 数据 库 之 上 。 数 据 库 系 
统 的 这 种 特点 决定 了 它 的 设计 方法 , 即 系统 设计 时 应 先 设计 数据 库 , 再 设计 功能 程序 ,而 不 
能 像 文件 系统 那样 , 先 设计 程序 ,再 考虑 程序 需要 的 数据 。 

在 数据 库 系 统 中 , 则 实现 了 整体 “结构 化 "。 所 谓 整体 “结构 化 ”, 是 指 在 数据 库 中 的 数据 
不 再 仅仅 针对 某 一 个 应 用 ,而 是 面向 整个 组 织 ; 不 仅 数据 内 部 是 结构 化 的 ,而 且 整体 是 结构 
化 的 ,数据 之 间 是 具有 联系 的 。 

在 关系 数据 库 中 ,关系 表 的 记录 之 间 的 这 种 联系 是 可 以 用 参照 完整 性 (相关 内 容 将 在 第 
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2 章 中 详细 讲解 ) 来 表述 的 。 例 如 : 如 果 向 SC 中 增加 一 个 学 生 的 考试 成 绩 ,但 是 这 个 学 生 
并 没有 出 现在 Student 关系 中 ,关系 数据 库 管 理 系统 (Relational DataBase Management 
System,RDBMS) 将 拒绝 执行 这 样 的 插入 操作 ,从 而 保证 了 数据 的 正确 性 。 而 在 文件 系统 
中 要 做 到 这 一 点 ,必须 由 程序 员 编写 一 段 代 码 在 应 用 程序 中 实现 。 

在 数据 库 系 统 中 实现 了 整体 数据 的 结构 化 。 也 就 是 说 ,不 仅 要 考虑 某 个 应 用 的 数据 结 
构 , 还 要 考虑 整个 组 织 的 数据 结构 。 例 如 ,一 个 学 校 的 信息 系统 中 不 仅 要 考虑 教务 处 的 学 生 
学 籍 管理 .选课 管理 ,还 要 考虑 学 生 处 的 学 生 人 事 管 理 ,同时 还 要 考虑 研究 生 院 的 研究 生 管 
理 、 人 事 处 的 职工 人 事 管理 .科研 处 的 科研 管理 等 。 因 此 ,学 校 信息 系统 中 的 学 生 数 据 就 要 
面向 各 个 处 室 的 应 用 ,而 不 仅仅 是 教务 处 的 一 个 学 生 选 课 应 用 。 可 以 按照 图 1-5 方式 为 该 
校 的 信息 系统 组 织 其 中 的 学 生 数 据 。 

学 生 基本 记录 

学 号 | 姓名 | 人 性别 | 年 龄 | 所 属 学 院 


|i “1 学 生 学 逢 i 


| 。 学生 选课 记录 
$5 


家 庭 出 身 | 籍贯 | 政治 面 狐 日 期 | 学 校 | 学 历 名 学 号 | 课程 号 | 学 期 | 成 绩 
奖惩 情 况 记录 上， 家庭 成 员 记录 上 课程 记录 
日 期 | 奖 息 条 目 姓名 [与 本 人 关系 | 详细 情况 | 课程 号 | 课程 名 称 


图 1-5 学 校 信息 系统 中 的 学 生 数 据 


这 种 数据 的 组 织 方式 为 各 部 门 提供 了 必要 的 记录 ,使 整体 数据 结构 化 了 。 这 就 要 求 在 
描述 数据 时 不 仅 要 描述 数据 本 身 ,还 要 描述 数据 之 间 的 联系 。 

在 数据 库 系 统 中 ,不 仅 数据 是 整体 结构 化 的 ,而 且 存 取 数 据 的 方式 也 很 灵活 ,可 以 存 取 
数据 库 中 的 某 一 个 数据 项 一 组 数据 项 一 个 记录 或 一 组 记录 。 而 在 文件 系统 中 ,数据 的 存 
取 单 位 是 记录 ,粒度 不 能 细 到 数据 项 。 

(2) 数据 库 系 统 的 数据 元 余 度 小 ,数据 共享 度 高 ,容易 扩充 。 

例如 某 一 学 校 中 学 生 处 管理 学 生 人 事 档 案 , 教 务 处 管理 学 生 学 习 情 况 ,所 用 到 的 学 生 数 
据 很 多 都 是 重复 的 。 相 同 的 数据 不 能 被 共享 ,必然 造成 数据 元 余 。 这 不 仅 浪费 系统 的 存储 
空间 ,而且 极 易 造 成 数据 之 间 的 不 相 容 性 与 不 一 致 性 。 

所 谓 数据 的 不 一 致 性 ,是 指 同一 数据 不 同 副本 的 值 不 一 样 。 采 用 人 工 管理 或 文件 系统 
管理 时 ,由 于 数据 被 重复 存储 , 当 不 同 的 应 用 使 用 和 修改 不 同 的 副本 时 就 很 容易 造成 数据 的 
不 一 致 。 

由 于 数据 库 系统 是 从 整体 角度 看 待 和 描述 数据 的 ,数据 不 再 是 面向 某 个 应 用 ,而 是 面向 
整个 系统 ,因此 数据 可 以 被 多 个 用 户 、 多 个 应 用 共享 使 用 。 数 据 共享 可 以 大 大 减少 数据 宛 
余 , 节 约 存 储 空 间 , 并 且 减 少 了 由 于 数据 宛 余 造成 的 不 一 致 带 来 的 数据 冲突 问题 ,另外 也 避 
免 了 由 此 产生 的 数据 维护 和 数据 统计 错误 等 问题 。 另 外 由 于 数据 面向 整个 系统 ,是 有 结构 
的 数据 ,不 仅 可 以 被 多 个 应 用 共享 使 用 ,而 且 容易 增加 新 的 应 用 。 这 就 使 得 数据 库 系统 弹性 
大 ,易于 扩充 ,可 以 适应 各 种 用 户 的 要 求 。 可 以 选取 整体 数据 的 各 种 子 集 用 于 不 同 的 应 用 系 
统 , 当 应 用 需求 改变 或 增加 时 ,只 要 重新 选取 不 同 的 子 集 或 加 上 一 部 分 数据 , 便 可 以 满足 新 
的 需求 。 


数据 元 余 度 小 是 指 重 复 的 数据 少 。 减 少 元 余数 据 可 以 带 来 以 下 优点 。 

@ 数据 量 小 可 以 节约 存储 空间 ,使 数据 的 存储 ,管理 和 查询 都 容易 实现 。 

@ 数据 元 余 度 小 可 以 使 数据 统一 ,避免 产生 数据 的 不 一 致 问 题 。 

@ 数据 元 余 度 小 便于 数据 维护 ,避免 数据 统计 错误 。 

数据 共享 度 高 使 得 数据 库 系 统 具 有 以 下 3 个 方面 的 优点 。 

@ 系统 现 有 用 户 或 程序 可 以 共同 使 用 数据 库 中 的 数据 。 

@ 当 系 统 需 要 扩充 时 ,再 开发 的 新 用 户 或 新 程序 还 可 以 共享 原 有 的 数据 资源 。 

@ 多 用 户 或 多 程序 可 以 在 同一 时 刻 共 同 使 用 同一 数据 。 

(3) 数据 库 系 统 的 数据 和 程序 之 间 具 有 较 高 的 独立 性 。 

在 文件 系统 中 ,由 于 文件 与 应 用 程序 联系 紧密 , 当 文 件 的 结构 发 生 改 变 时 ,必须 修改 相 
应 的 应 用 程序 ,包括 修改 记录 结构 定义 和 应 用 程序 的 数据 处 理 部 分 。 此 外 ,如 果 应 用 程序 发 
生 改 变 也 可 能 影响 文件 的 定义 ,因此 文件 系统 的 数据 独立 性 差 。 

在 数据 库 系统 中 ,由 于 数据 库 中 的 数据 定义 功能 ( 即 描述 数据 结构 和 存储 方式 的 功能 ) 
和 数据 管理 功能 ( 即 实现 数据 查询 .统计 和 增删 改 的 功能 ) 是 由 DBMS 提供 的 ,所 以 数据 对 
应 用 程序 的 依赖 程度 大 大 降低 ,数据 和 程序 之 间 具 有 较 高 的 独立 性 。 数 据 和 程序 之 间 的 依 
赖 程度 低 、 独 立 程度 大 的 特性 称 为 数据 独立 性 高 。 数 据 独 立 性 高 使 得 在 应 用 程序 中 不 再 需 
要 有 关 数 据 结 构 和 存储 方式 的 描述 ,从 而 减轻 了 程序 设计 的 负担 。 当 数据 及 结构 变化 时 ,如 
果 数 据 独 立 性 高 ,维护 应 用 程序 也 会 比较 容易 。 

数据 库 中 的 数据 独立 性 可 以 分 为 两 级 。 

数据 的 物理 独立 性 (Physical Data Independence) 

物理 独立 性 是 指 用 户 的 应 用 程序 与 存储 在 磁盘 上 的 数据 库 中 的 数据 是 相互 独立 的 。 数 
据 在 磁盘 上 的 数据 库 中 怎样 存储 是 由 DBMS 管理 的 ,用 户 程序 不 需要 了 解 ,应 用 程序 要 处 
理 的 只 是 数据 的 逻辑 结构 ,这样 当 数据 的 物理 结构 发 生变 化 时 (例如 当 数据 文件 的 组 织 方式 
被 改变 或 数据 存储 位 置 发 生变 化 时 ) ,应 用 程序 不 需要 修改 也 可 以 正常 工作 。 数 据 库 系统 之 
所 以 具有 数据 物理 独立 性 高 的 特点 ,是 因为 数据 库 管理 系统 能 够 提供 数据 的 物理 结构 与 多 
辑 结构 之 间 的 映像 (Mapping) 或 转换 功能 。 正 因为 数据 库 系 统 具有 这 种 数据 映像 功能 , 才 
使 得 应 用 程序 可 以 根据 数据 的 多 辑 结构 进行 设计 ,并 且 一 旦 数据 的 存储 结构 发 生变 化 ,系统 
可 以 通过 修改 其 映像 来 适应 其 变化 ,所 以 数据 物理 结构 的 变化 不 会 影响 应 用 程序 的 正确 
执行 。 

@ 数据 的 逻辑 独立 性 (Logical Data Independence) 

逻辑 独立 性 是 指 用 户 的 应 用 程序 与 数据 库 的 逻辑 结构 是 相互 独立 的 ,也 就 是 说 ,数据 的 
逻辑 结构 改变 了 ,用 户 程 序 也 可 以 不 变 。 

数据 库 中 的 数据 迎 辑 结构 分 全 局 逻辑 结构 和 局 部 巡 辑 结构 两 种 。 数 据 全 局 逮 辑 结构 指 
全 系统 总 体 的 数据 逻辑 结构 , 它 是 按 全 系统 使 用 的 数据 数据 的 属性 及 数据 之 间 的 联系 来 组 
织 的 。 数 据 局 部 逻辑 结构 是 指 一 个 用 户 或 一 个 应 用 程序 使 用 的 数据 逻辑 结构 , 它 是 根据 用 
户 自己 对 数据 的 需求 进行 组 织 的 。 局 部 逻辑 结构 中 仅 涉及 与 该 用 户 ( 或 程序 ) 相 关 的 数据 结 
构 。 数 据 局 部 逻辑 结构 与 全 局 逻辑 结构 之 间 是 不 完全 统一 的 ,两 者 之 间 可 能 会 有 较 大 的 
差异 。 

数据 的 逻辑 独立 性 是 指 应 用 程序 对 数据 全 局 逻辑 结构 的 依赖 程度 。 数 据 逻辑 独立 性 高 
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是 指 当 数据 库 系统 的 数据 全 局 逻辑 结构 改变 时 ,它们 对 应 的 程序 不 需要 改变 仍 可 以 正常 运 
行 。 例 如 当 新 增加 一 些 数 据 和 联系 时 ,不 影响 某 些 局 部 逻辑 结构 的 性 质 。 

数据 库 系 统 之 所 以 具有 较 高 的 数据 逻辑 独立 性 ,是 由 于 它 能 够 提供 数据 的 全 局 逻辑 结 
构 和 局 部 逻辑 结构 之 间 的 映像 和 转换 功能 。 正 因为 数据 库 系统 具有 这 种 数据 映像 功能 ,使 
得 数据 库 可 以 按 数据 全 局 逻辑 结构 设计 ,而 应 用 程序 可 以 按 数据 局 部 逻辑 结 构 进 行 设计 。 
这 样 , 既 保证 了 数据 库 中 的 数据 优化 性 质 ,又 可 以 使 用 户 按 自己 的 意愿 和 要 求 组 织 数据 , 数 
据 具 有 整体 性 .共享 性 和 方便 性 。 同 时 , 当 全 局 逻辑 结构 中 的 部 分 数据 结构 改变 时 ,即使 那 
些 与 变化 相关 的 数据 局 部 逻辑 结构 受到 了 影响 ,也 可 以 通过 修改 全 局 逻辑 结构 的 映像 来 减 
小 甚 受 影响 的 程度 ,使 数据 局 部 逻辑 结构 基本 上 保持 不 变 。 由 于 数据 库 系 统 中 的 程序 是 按 
局 部 数据 逻辑 结构 进行 设计 的 ,并 且 当 全 局 数据 逻辑 结构 变换 时 可 以 使 局 部 数据 逻辑 结构 
基本 保持 不 变 , 所 以 数据 库 系统 的 数据 逻辑 独立 性 高 。 

数据 与 程序 的 独立 ,把 数据 的 定义 从 程序 中 分 离 出 去 ,加 上 存 取 数 据 的 方法 又 由 DBMS 
负责 提供 ,从 而 简化 了 应 用 程序 的 编制 ,大 大 减少 了 应 用 程序 的 维护 和 修改 时 间 。 

数据 独立 性 是 由 DBMS 的 二 级 映像 功能 来 保证 的 ,相关 内 容 将 在 1. 3 节 具 体 讨论 。 

(4) 数据 由 DBMS 统一 管理 和 控制 。 

数据 库 的 共享 是 并 发 的 (Coneurrency) 共 享 , 即 多 个 用 户 可 以 同时 存 取 数 据 库 中 的 数据 
甚至 可 以 同时 存 取 数据 库 中 同一 个 数据 。 

为 此 ,DBMS 还 必须 提供 以 下 几 方 面 的 数据 控制 功能 。 

@ 数据 的 安全 性 控制 (Security Control) 。 

数据 的 安全 性 是 指 保护 数据 ,以 防止 不 合法 的 使 用 造成 的 数据 的 泄漏 .破坏 和 更 改 。 数 
据 安全 性 受到 威胁 是 指出 现 用 户 看 到 了 不 该 看 到 的 数据 ,修改 了 无 权 修 改 的 数据 ,删除 了 不 
能 删除 的 数据 等 现象 。 使 每 个 用 户 只 能 按 规定 ,对 某 些 数据 以 某 些 方式 进行 使 用 和 处 理 。 
数据 安全 性 被 破坏 有 两 种 情况 : 

。 有 意 的 破坏 行为 。 用 户 有 超越 自身 的 数据 操作 权 的 行为 。 例 如 ,非法 截取 信息 或 蓄 

意 传播 计算 机 病毒 导致 数据 库 竣 痪 。 
。 无 意 的 破坏 行为 。 出 现 了 违背 用 户 操作 意愿 的 结果 。 例 如 ,由 于 不 懂 操 作 规则 或 出 
现 计 算 机 硬件 故障 ,使 数据 库 不 能 使 用 。 

数据 库 系 统 通过 它 的 数据 保护 措施 能 够 防止 数据 库 中 的 数据 被 破坏 。 例 如 使 用 用 户 身 
份 鉴别 和 数据 存 取 控制 等 方法 ,万 一 数据 被 破坏 ,系统 也 可 以 进行 数据 恢复 ,以 确保 数据 的 
安全 性 。 关 于 数据 库 安全 性 相关 知识 将 在 第 6 章 介绍 。 

@ 数据 的 完整 性 控制 (Integrity Control) 。 

数据 的 完整 性 指数 据 的 正确 性 有 效 性 和 相 容 性 。 就 是 将 数据 扩展 在 有 效 的 范围 内 ,或 
保证 数据 之 间 满 足 一 定 的 关系 。 防 止 不 符合 语义 的 数据 输入 或 输出 所 采用 的 控制 机 制 。 对 
于 具体 的 一 个 数据 ,总 会 受到 一 定 的 完整 性 检查 ,将 数据 控制 在 有 效 的 范围 内 ,如 果 数 据 不 
满足 其 条 件 , 它 就 是 不 符合 语义 的 数据 或 是 不 合理 的 数据 。 这 些 约束 条 件 可 以 是 数据 自身 
的 约 东 ,也 可 以 是 数据 结构 的 约束 。 

数据 库 系统 的 完整 性 控制 包括 两 项 内 容 : 一 是 提供 进行 数据 完整 性 定义 的 方法 ,用 户 
要 利用 此 方法 定义 数据 应 满足 的 完整 性 条 件 。 二 是 提供 进行 检验 数据 完整 性 的 功能 ,特别 
是 在 数据 输入 和 输出 时 ,系统 应 自动 检查 其 是 否 符合 已 定义 的 完整 性 条 件 , 以 避免 错误 的 数 


据 进 入 到 数据 库 或 从 数据 库 中 流出 ,造成 不 良 的 后 果 。 数 据 完 整 性 的 高 低 是 决定 数据 库 中 
数据 的 可 靠 程度 和 可 信 程 度 的 主要 因素 。 关 于 数据 库 完 整 性 相关 知识 将 在 第 7 章 介绍 。 

@ 数据 库 恢 复 (Recovery Control) 。 

计算 机 系统 的 硬件 故障 、 软 件 故障 、 操 作 员 的 失误 以 及 故意 的 破坏 也 会 影响 数据 库 中 数 
据 的 正确 性 ,甚至 造成 数据 库 部 分 或 全 部 数据 的 丢失 。DBMS 必须 具有 将 数据 库 从 错误 的 
状态 恢复 到 某 一 已 知 的 正确 状态 ( 亦 称 为 完整 状态 或 一 致 状态 ) 的 功能 。 数 据 恢复 是 通过 记 
录 数 据 库 运行 的 日 志文 件 和 定期 做 数据 备份 工作 ,保证 数据 在 受到 破坏 时 ,能 够 及 时 使 数据 
库 恢 复 到 正确 状态 ,这 就 是 数据 库 的 恢复 功能 。 关 于 数据 库 安 全 性 相关 知识 将 在 第 8 章 
介绍 。 

@ 并 发 控制 (Concurrency Control) 。 

当 多 个 用 户 的 并 发 进程 同时 存 取 、 修 改 数 据 库 时 ,可 能 会 发 生 相互 干扰 而 得 到 错误 的 结 
果 或 使 数据 库 的 完整 性 遭 到 破坏 ,因此 必须 对 多 用 户 的 并 发 操作 加 以 控制 和 协调 。 排 除 由 
于 数据 共享 , 即 用 户 并 行使 用 数据 库 中 的 数据 时 ,所 造成 的 数据 不 完整 和 系统 运行 错误 问 
题 。 关 于 数据 库 安全 性 相关 知识 将 在 第 9 章 介 绍 。 

@ 数据 库 中 数据 的 最 小 存 取 单位 是 数据 项 。 

我 们 知道 ,在 文件 系统 中 ,数据 的 最 小 存 取 单 位 是 记录 ,这 给 数据 操作 及 使 用 带 来 诸多 
不 便 。 数 据 库 系统 改善 了 文件 系统 的 不 足 , 它 的 最 小 数据 存 取 单位 是 数据 项 (字段 ) ,就 是 
在 使 用 时 既 可 以 按 数据 项 或 数据 项 组 存 取 数据 ,也 可 以 按 记 录 或 记录 组 存 取 数 据 。 由 于 
数据 库 中 数据 的 最 小 存 取 单位 是 数据 项 ,使 系统 在 进行 查询 、 统 计 、 修 改 及 数据 再 组 合 等 
操作 时 ,能 以 数据 项 为 单位 进行 条 件 表 达 和 数据 存 取 处 理 , 给 系统 带 来 了 高 效 性 、 灵 活性 
和 方便 性 。 

数据 库 管 理 阶段 应 用 程序 与 数据 之 间 的 对 应 关系 可 用 图 1-6 表示 。 


应 用 程序 1 


应 用 程序 2 
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1-6 数据 库 管 理 阶 段 应 用 程序 与 数据 之 间 的 对 应 关系 


了 解 了 数据 库 系统 的 特点 ,我 们 可 以 给 出 数据 库 的 定义 。 

综 上 所 述 ,数据 库 就 是 长 期 存储 在 计算 机 内 有 组 织 的 大 量 的 共享 的 数据 集合 。 它 可 以 
供 各 种 用 户 共享 ,具有 最 小 的 元 余 度 和 较 高 的 数据 独立 性 。DBMS 在 数据 库 建 立 、 运 用 和 
维护 时 对 数据 库 进 行 统一 控制 ,以 保证 数据 的 完整 性 和 安全 性 ,并 在 多 用 户 同时 使 用 数据 库 
时 进行 并 发 控制 ,在 发 生 故 障 后 对 数据 库 进行 恢复 。 

数据 库 系 统 的 出 现 使 信息 系统 从 以 加 工 数据 的 程序 为 中 心 转向 围绕 共享 的 数据 库 为 中 
心 的 新 阶段 。 这 样 既 便于 数据 的 集中 管理 ,又 有 利于 应 用 程序 的 研制 和 维护 ,提高 了 数据 的 
利用 率 和 相 容 性 。 
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1.2 数据 模型 


数据 模型 是 一 种 表示 数据 及 其 联系 的 模型 ,是 对 现实 世界 数据 特征 与 联系 的 抽象 反映 。 
也 就 是 说 数据 模型 是 用 来 描述 数据 组 织 数据 和 对 数据 进行 操作 的 。 

由 于 计算 机 不 可 能 直接 处 理 现实 世界 中 的 具体 事物 ,所 以 人 们 必须 事先 把 具体 事物 转 
换 成 计算 机 能 够 处 理 的 数据 , 即 首先 要 数字 化 ,把 现实 世界 中 具体 的 人 、 物 、 活 动 、 概 念 用 数 
据 模型 这 种 工具 来 抽象 ,表示 和 处 理 。 

通俗 地 讲 , 数 据 模型 就 是 现实 世界 的 模型 。 

现 有 的 数据 库 系 统 均 是 基于 某 种 数据 模型 的 ,数据 模型 是 数据 库 系统 的 核心 和 基础 。 
因此 ,了 解数 据 模型 的 基本 概念 是 学 习 数 据 库 的 基础 。 

数据 库 系 统 是 一 个 基于 计算 机 的 、 统 一 集中 的 数据 管理 机 构 。 而 现实 世界 是 纷繁 复杂 
的 ,那么 现实 世界 中 各 种 复杂 的 信息 及 其 相互 联系 是 如 何 通过 数据 库 中 的 数据 来 反映 的 呢 ? 
这 就 是 本 节 要 讨论 的 问题 。 


1.2.1 数据 描述 的 三 个 世界 


数据 库 管 理 系统 是 采用 数据 模型 来 为 现实 世界 的 数据 建 模 , 把 现实 世界 错综复杂 联系 
的 事物 以 计算 机 所 能 理解 和 表现 的 形式 反映 到 数据 库 中 ,这 是 一 个 逐步 转化 的 过 程 ,这 个 转 
化 一 般 分 为 三 个 阶段 ,我 们 称 之 为 三 个 世界 , 即 现 实 世 界 ,信息 世界 及 机 器 世界 (或 计算 机 世 
界 )。 现 实 世 界 中 一 些 事物 的 某 些 方面 的 特征 及 事物 间 的 相互 联系 ,这 些 经 过 人 类 大 脑 的 认 
识 , 分 析 和 抽象 后 ,并 用 一 定 的 方法 加 以 描述 , 即 得 到 信息 世界 的 信息 ,这 种 信息 结构 并 不 依 
赖 于 具体 的 计算 机 系统 ,而 是 概念 级 模型 ; 然后 再 将 信息 世界 的 信息 进一步 具体 描述 、 规 
范 , 最 后 再 将 概念 模型 转换 成 某 一 DBMS 支持 的 数据 模型 , 则 成 为 机 器 世界 的 数据 。 

1. 现实 世界 

现实 世界 就 是 客观 存在 的 世界 , 它 是 由 各 种 事物 、 事 物 之 间 的 相互 联系 及 事物 的 发 生 、 
变化 过 程 组 成 的 。 通 常 选用 人 们 感 兴趣 的 以 及 最 能 表示 事物 本 质 的 若干 特征 来 描述 事物 。 
如 在 学 生 档 案 管理 中 ,学 生 的 特征 可 用 姓名 、 学 号 .性 别 、 年 龄 等 来 描述 ,还 可 用 表示 人 的 生 
理 特 征 的 数据 如 身高 体重、 相片 等 来 表示 。 同 时 事物 之 间 的 联系 也 是 丰富 多 样 的 。 如 在 学 
校 中 ,有 教师 与 学 生 的 教学 关系 、 学 生 与 课程 的 选课 关系 等 。 要 想 让 现实 世界 事物 在 计算 机 
的 数据 库 中 得 以 展现 ,重要 的 就 是 将 那些 最 有 用 的 事物 特征 及 其 相互 间 的 联系 提取 出 来 。 

2. 信息 世界 

信息 世界 是 现实 世界 在 人 脑 中 的 反映 ,经 过 人 类 头脑 的 分 析 归纳 、 抽 象 ,形成 信息 。 对 
这 些 信息 进行 记录 整理 , 归 类 和 形式 化 后 ,形成 一 些 基 本 概念 及 联系 ,它们 就 构成 了 信息 世 
界 。 现 实 世 界 中 的 事物 .事物 特性 和 事物 之 间 的 联系 在 信息 世界 中 分 别 反映 为 实体 、 实 体 的 
属性 和 实体 之 间 的 联系 。 信 息 世 界 是 一 种 相对 抽象 化 的 世界 , 它 介 于 现实 世界 与 计算 机 世 
界 之 间 ,起 着 承上启下 的 作用 。 信 息 世 界 涉及 的 概念 主要 有 : 

1) 实体 

客观 存在 并 可 相互 区 别 的 事物 或 概念 称 为 实体 (Entity)。 可 以 是 具体 的 人 、 事 、 物 ,也 
可 以 是 抽象 的 概念 或 联系 ,例如 ,一 名 学 生 、 一 所 学 校 ,一 门 课程 ,学 生 的 一 次 选课 教师 的 授 


课 、 老 师 与 院 系 的 工作 关系 ( 即 某 位 老师 在 某 院 系 工作 ) 等 都 是 实体 。 

2) 属性 

描述 实体 所 具有 的 某 一 特性 称 为 属性 (Attribute) 。 一 个 实体 可 以 由 若干 个 属性 来 刻 
画 。 例 如 ,学 生 实体 可 以 由 学 号 、 姓 名、 性 别 .出 生年 月 .所 在 院 系 . 和 人 学 时 间 、 家 庭 住址 等 属 
性 组 成 ,如 (1703070101、 李 艺 . 女 .199905、 信 息 科 学 与 工程 学 院 .2017)。 这 些 属性 组 合 起 来 
表征 了 一 个 学 生 实体 。 

3) 码 

唯一 标识 每 个 实体 的 最 小 属性 集 称 为 码 (Key)。 每 一 个 实体 集 一 定 有 实体 码 。 例 如 学 
号 是 学 生 实体 的 码 , 身 份 证 号 码 是 我 们 每 一 个 人 的 码 (唯一 标识 ) 。 

4) 域 

属性 的 取 值 范围 称 为 该 属性 的 域 (Domain) 。 每 个 属性 都 有 值 , 且 有 一 定 的 取 值 范围 。 
例如 ,学 号 的 域 为 10 位 整数 ,性 别 的 域 为 ( 男 , 女 ) 等 。 

5) 实体 型 

具有 相同 属性 的 实体 必然 具有 共同 的 特征 和 性 质 。 实 体型 (Entity Type) 是 对 某 一 类 
数据 的 结构 和 特征 的 描述 , 它 是 用 实体 名 及 其 属性 名 集合 来 抽象 和 刻画 同类 实体 的 。 如 学 
生 实体 ,我们 可 以 这 么 描述 : 学 生 ( 学 号 、 姓 名 性别、 出 生年 月 、 所 在 院 系 、 入 学 时 间 ); 而 选 
课 实体 ,可 以 这 样 描述 : 选课 (学 号 .课程 号 .成绩 ) 。 

实体 值 是 实体 型 的 一 个 具体 内 容 ,是 由 描述 某 实体 型 的 各 属性 值 构 成 的 。 如 
(1703070101、 李 艺 、 女 .199905 ,信息 科学 与 工程 学 院 ,2017) 是 学 生 实 体型 的 一 个 具体 内 容 。 

6) 实体 集 

同一 类 型 实体 的 集合 称 为 实体 集 (Entity Set)。 例 如 ,全 体 学 生 就 是 一 个 实体 集 。 

7) 联系 

在 现实 世界 中 ,事物 内 部 以 及 事物 之 间 是 有 联系 (Relationship) 的 ,这 些 联 系 在 信息 世 
界 中 反映 为 实体 内 部 的 联系 和 实体 之 间 的 联系 。 实 体内 部 的 联系 通常 是 指 组 成 实体 的 各 属 
性 之 间 的 联系 ,实体 之 间 的 联系 通常 是 指 不 同 实 体 集 之 间 的 联系 。 

例如 ,实体 内 部 的 联系 。“ 教 工 " 实 体 的 “职称 ”与 “工资 等 级 "属性 之 间 就 有 一 定 的 联系 
(约束 条 件 ) ,教工 的 职称 越 高 ,往往 工资 等 级 也 就 越 高 。 实 体 之 间 的 联系 ,例如 "学生" 实体 
和 “课程 ”实体 ,联系 是 学 生 选 课 。 

3. 机 器 世界 

信息 结构 并 不 依赖 于 具体 的 计算 机 系统 ,不 是 某 一 个 DBMS 支持 的 数据 模型 。 即 信息 
世界 是 概念 级 的 模型 (之 后 我 们 会 具体 谈 到 ), 我 们 要 把 概念 模型 转换 为 计算 机 上 某 一 
DBMS 支持 的 数据 模型 。 

用 计算 机 管理 信息 ,必须 对 信息 进行 数据 化 ,数据 化 后 的 信息 则 成 为 机 器 世界 的 数据 ， 
数据 是 能 够 被 计算 机 识别 ,存储 并 处 理 的 ,数据 化 了 的 信息 世界 称 之 为 机 器 世界 。 

机 器 世界 涉及 的 概念 主要 有 以 下 几 种 。 

1) 数据 项 

数据 项 (Item) 是 对 象 属性 的 数据 表示 。 数 据 项 有 型 和 值 之 分 ,数据 项 的 型 是 对 数据 特 
性 的 表示 , 它 通过 数据 项 的 名 称 、 数 据 类 型 .数据 宽度 和 值 域 等 来 描述 数据 项 ; 值 是 其 具体 1 
取 值 。 数 据 项 的 型 和 值 都 要 符合 计算 机 数据 的 编码 要 求 , 即 都 要 符合 数据 的 编码 要 求 。 章 
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2) 记录 

记录 (Record) 是 数据 项 的 有 序 集合 。 一 个 记录 描述 一 个 实体 。 记 录 有 型 和 值 之 分 , 记 
录 的 型 是 结构 ,由 数据 项 的 型 构成 ; 记录 的 值 表示 对 象 中 的 一 个 实例 , 它 的 分 量 是 数据 
项 值 。 

例如 : (学 号 、 姓 名、 性 别 、 出 生年 月 .所 在 学 院 、 入 学 年 份 ) 是 一 个 学 生 的 记录 型 ,而 
(1703070101、 李 艺 、 女 .199905 ,信息 科学 与 工程 学 院 、2017) 是 一 个 学 生 的 记录 值 。 它 表示 
学 生 对 象 的 一 个 实例 ,1703070101、 李 艺 、 女 等 都 是 数据 项 值 。 

3) 文件 

文件 (File) 是 同一 类 记录 的 集合 ,同一 个 文件 中 的 记录 类 型 应 是 一 样 的 。 它 描述 实体 
集 ,一 个 记录 描述 一 个 实体 。 

例如 ,将 所 有 学 生 的 登记 表 组 成 一 个 学 生 数 据 文件 ,文件 中 的 每 条 记录 都 要 按 ( 学 号 、 姓 
名 ,性 别 、 出 生年 月 ,所 在 学 院 、 入 学 年 份 ) 这 样 的 结构 组 织 数 据 项 值 。 

4) 键 

键 (Key) 是 用 于 标识 文件 中 每 个 记录 的 字段 或 字段 集 。 

5) 数据 模型 

现实 世界 中 的 事物 反映 到 计算 机 世界 中 就 形成 了 文件 的 记录 结构 和 记录 ,事物 之 间 的 
相互 联系 就 形成 了 不 同文 件 间 的 记录 的 联系 。 记 录 结 构 及 其 记录 联系 的 数据 化 的 结果 就 是 
数据 模型 (Data Model) 。 

三 个 世界 术语 虽 各 不 相同 ,但 它们 之 间 有 着 对 应 关系 ,三 个 世界 术语 间 的 关系 如 图 1-7 
所 示 。 
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图 1-7 三 个 世界 术语 间 关 系 


4. 现实 世界 、 信 息 世 界 和 机 器 世界 的 关系 

现实 世界 ,信息 世界 和 机 器 世界 这 3 个 领域 是 由 客观 到 认识 ,由 认识 到 使 用 管理 的 3 个 
不 同 层次 ,后 一 领域 是 对 前 一 个 领域 的 抽象 描述 。 

现实 世界 、 信 息 世 界 和 机 器 世界 的 转换 关系 可 以 用 图 1-8 来 描述 。 


认识 、 分 析 、 

抽象 描述 
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图 1-8 信息 的 三 种 世界 的 联系 和 抽象 过 程 


在 不 同 的 环境 下 解释 同一 个 客观 对 象 时 ,经 常会 以 不 同 的 方式 进行 描述 。 

在 数据 库 技术 中 ,根据 模型 应 用 的 不 同 目的 ,把 模型 划分 为 两 类 , 即 概念 模型 和 数据 模 
型 。 在 信息 世界 中 ,对 所 研究 的 信息 需 建 立 一 个 抽象 的 模型 ,以 反映 实体 集 及 实体 集 之 间 的 
联系 ,人 们 称 之 为 概念 模型 , 它 是 从 用 户 的 观点 来 对 数据 建 模 , 主 要 用 于 数据 库 设 计 ; 在 机 
器 世界 则 采用 数据 模型 来 具体 描述 、 刻 画 实 体 集 及 实体 集 之 间 的 联系 , 它 是 从 计算 机 系统 的 
观点 来 对 数据 建 模 ,主要 用 于 数据 库 管 理 系统 的 实现 。 


1.2.2 概念 模型 


概念 模型 (也 称 信息 模型 ) 是 对 信息 世界 的 管理 对 象 . 属 性 及 联系 等 信息 的 描述 形式 , 它 
是 对 现实 世界 真实 ` 全 面 的 反映 ,是 现实 世界 到 机 器 世界 的 一 个 中 间 层 次 ,是 一 种 独立 于 计 
算 机 系统 的 数据 模型 。 

当 现 实 世 界 的 事物 反映 到 人 的 大 脑 中 来 ,人 们 首先 把 这 些 事物 抽象 为 一 种 既 不 依赖 于 
具体 的 计算 机 系统 又 不 受 某 具体 的 DBMS 所 左右 的 概念 模型 ,概念 模型 是 按 用 户 的 观点 对 
数据 进行 建 模 , 强 调 其 语义 表达 能 力 ,概念 应 该 简单 、 清 晰 、 易 于 用 户 理解 ,完全 不 涉及 信息 
在 计算 机 中 的 表示 , 它 是 对 现实 世界 的 第 一 层 抽象 ,是 用 户 和 数据 库 设 计 人 员 之 间 进 行 交流 
的 语言 。 

1. 概念 模型 的 基本 概念 

概念 模型 是 对 信息 世界 的 描述 ,上 一 节 已 经 对 信息 世界 的 基本 概念 进行 了 详细 的 介绍 ， 
在 此 我 们 不 再 获 述 。 接 下 来 我 们 了 解 一 下 实体 之 间 联 系 的 基本 概念 。 

实体 集 间 的 联系 包括 两 类 : 实体 集 之 间 的 联系 与 实体 集 内 部 的 联系 。 而 实体 集 间 的 联 
系 又 分 为 两 实体 集 间 的 联系 、 多 实体 集 间 的 联系 。 

实体 集 之 间 的 联系 是 指 不 同 实体 集 之 间 的 联系 。 例 如 ,学 生 实 体 与 课程 实体 、 学 院 实体 
与 班级 实体 的 联系 。 实 体 集 内 部 的 联系 是 指 实体 集 的 各 属性 之 间 的 相互 联系 。 例 如 : 学 生 
实体 集 的 “姓名 ”与 其 “学 号 "有 一 个 对 应 关系 ; 教工 实体 集 的 “职称 ”与 其 “指导 研究 生 " 之 间 
有 一 定 的 约束 联系 ,如 果 不 是 “副教授 ”及 以 上 的 职称 , 则 不 能 指导 研究 生 。 

实体 集 间 的 联系 分 为 : 两 个 实体 集 间 的 联系 、 多 个 实体 集 间 的 联系 及 实体 集 内 部 的 
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联系 。 

1) 两 个 实体 集 间 的 联系 

两 个 实体 集 间 的 联系 分 为 三 类 : 一 对 一 联系 (1 : 1) 一 对 多 联系 (1 : n) ,多 对 多 联系 (1m : n)。 

(1) 一 对 一 联系 (1: 1) 

设 有 两 个 实体 集 A 和 了 ,如 果实 体 集 A 与 实体 集 B 之 间 具 有 一 对 一 联系 , 则 对 于 实体 
集 A 中 的 每 一 个 实体 ,在 实体 集 B 中 至 多 有 一 个 (也 可 以 没有 ) 实 体 与 之 联系 ,反之 亦 然 。 
则 称 A、B 两 个 实体 集 间 的 联系 是 一 对 一 联系 , 记 作 1 : 1。 例 如 ,在 一 个 班级 里 只 有 一 个 正 
班长 ,而 一 个 正 班长 只 能 在 一 个 班级 里 任职 , 则 班长 与 班级 之 间 的 联系 就 是 一 对 一 联系 。 

(2) 一 对 多 联系 (1 : n) 

设 有 两 个 实体 集 A 和 B, 如 果实 体 集 A 与 实体 集 B 之 间 具 有 一 对 多 联系 , 则 对 于 实体 
集 A 的 每 一 个 实体 ,实体 集 B 中 有 nn 实体 (n 宇 0) 与 之 联系 ,反之 ,对 于 实体 集 B 的 每 一 个 实 
体 ,实体 集 A 中 只 有 一 实体 与 之 联系 , 则 称 A、B 两 个 实体 集 之 间 的 联系 是 一 对 多 联系 , 记 
作 1:n。 例 如 ,一 个 学 校 里 有 多 名 学 生 , 而 每 个 学 生 只 能 在 一 个 学 校 里 学 习 , 则 学 校 与 学 生 
之 间 具 有 一 对 多 联系 。 

(3) 多 对 多 联系 (mm : n) 

设 有 两 个 实体 集 A 和 B, 如 果实 体 集 A 与 实体 集 B 之 间 具 有 多 对 多 联系 , 则 对 于 实体 
集 A 的 每 一 个 实体 ,实体 集 B 中 及 实体 (n 三 0) 与 之 联系 ,反之 , 则 对 于 实体 集 B 中 的 每 一 
个 实体 ,实体 集 A 中 也 及 个 实体 (m 宇 0) 与 之 联系 , 则 称 A、B 两 个 实体 集 之 间 的 联系 为 
多 对 多 联系 , 记 作 (m : n)。 例 如 ,学 校 里 的 一 个 学 生 可 以 选修 多 门 课程 ,而 每 一 门 课程 可 以 
有 多 个 学 生 选 修 , 则 学 生 和 课程 之 间 具 有 多 对 多 联系 。 

实际 上 ,一 对 一 联系 是 一 对 多 联系 的 特例 ,而 一 对 多 联系 又 是 多 对 多 联系 的 特例 。 如 
图 1-9 是 用 E-R 图 表示 两 个 实体 集 之 间 的 1:1、1: nm:n 联 系 的 例子 。 


实体 型 A 实体 型 A 

1 1 

1 n 
实体 型 B 实体 型 B 
(a 1: 1 联系 ) (b) 1 :nn 联系 


1- 9 两 个 实体 集 联系 的 例子 


2) 多 实体 集 之 间 的 联系 

实际 上 ,两 个 以 上 的 实体 集 之 间 也 会 存在 联系 ,其 联系 类 型 一 般 为 一 对 多 和 多 对 多 。 

(1) 多 实体 集 之 间 的 一 对 多 联系 。 

设 实体 集 Ei ,E: ,…,E, ,如 果 E;(j 二 1,2,…,n), 与 其 他 实体 集 Ei ,Es,… Ei, Er 
E, 之 间 存 在 有 一 对 多 的 联系 , 则 ,对 子 E; 中 的 一 个 给 定 实体 ,可 以 与 其 他 实体 集 E;(i 隆 站 
中 的 一 个 或 多 个 实体 联系 ,而 实体 集 Ei(i 关 站 中 的 一 个 实体 最 多 只 能 与 E; 中 的 一 个 实体 联 


系 , 则 称 EE; 与 E, ,E: ,…Ei-:,Ei+l…E, 之 间 的 联系 是 一 对 多 的 。 

例如 ,对 于 课程 教师 与 参考 书 3 个 实体 型 ,如 果 一 门 课程 可 以 有 若干 个 教师 讲授 ,使 用 
若干 本 参考 书 , 而 每 一 个 教师 只 讲授 一 门 课程 ,每 一 本 参考 书 只 供 一 门 课程 使 用 , 则 课程 与 
教师 ,参考 书 之 间 的 联系 是 一 对 多 的 ,如 图 1-10(a) 所 示 。 


课程 供应 商 
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m n 3 ? 
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图 1-10 三 个 实体 集 联系 的 实例 


(2) 多 实体 集 之 间 的 多 对 多 联系 。 

在 两 个 以 上 的 多 个 实体 集 之 间 , 当 一 个 实体 集 与 其 他 实体 集 之 间 均 存在 多 对 多 联系 ,而 
其 他 实体 集 之 间 没 有 联系 时 ,这 种 联系 称 为 多 实体 集 间 的 多 对 多 联系 。 

例如 ,有 供应 商 、 项 目 、 零 件 三 个 实体 集 , 一 个 供应 商 可 以 供给 多 个 项 目 、 多 种 零件 ,每 个 
项 目 可 以 使 用 多 个 供应 商 供应 的 零件 ,每 种 零件 可 由 不 同 供应 商 供给 。 因 此 ,供应 商 ,项 目 、 
零件 三 个 实体 型 之 间 是 多 对 多 的 联系 ,如 图 1-10(b) 所 示 。 


(3) 实体 集 内 部 的 联系 
实际 上 ,在 一 个 实体 集 内 的 实体 之 间 也 可 以 存在 一 对 一 、 a by 
一 对 多 或 多 对 多 的 联系 。 例 如 :职工 是 一 个 实体 集 ,职工 中 有 <es> 


领导 ,而 领导 自身 也 是 职工 。 职 工 实体 集 内 部 具有 领导 与 被 领 
导 的 联系 , 即 某 一 个 职工 领导 若干 名 职工 。 而 一 个 职工 仅 被 一 ”图 1-11 同一 实体 集 内 的 
个 领导 所 领导 ,这 种 联系 是 一 对 多 的 联系 ,如 图 1-11 所 示 。 一 对 多 联系 

2. 概念 模型 的 表示 方法 

概念 模型 是 对 信息 世界 的 建 模 ,概念 模型 应 当 能 够 全 面 、 准 确 、 方 便 地 描述 出 信息 世界 
中 的 基本 概念 。 概 念 模型 的 表示 方法 很 多 ,其 中 最 为 著名 的 和 使 用 最 广泛 的 是 P. P. Chen 
于 1976 年 提出 的 实体 一 联系 方法 (Entity-Relationship Approach, 即 E-R 方法 )。 该 方法 用 
E-R 图 来 描述 现实 世界 的 概念 模型 , 故 又 称 实体 -联系 模型 。E-R 图 也 称 为 E-R 模型 。 该 模 
型 提供 了 表示 实体 集 、 属 性 和 联系 的 方法 。 在 E-R 图 中 ,事物 用 实体 型 表示 ,事物 的 特征 用 
属性 表示 ,事物 之 间 的 关联 用 联系 表示 。 概 念 模型 是 数据 库 设计 的 有 效 工具 。 

(1) 用 和 矩形 表示 实体 ,矩形 框 内 写实 体 名 。 

(2) 用 椭圆 形 表示 实体 的 属性 ,并 用 无 向 边 将 其 与 相应 的 实体 型 连接 起 来 。 例 如 ,学 生 
具有 学 号 、 姓 名 性别, 年龄、 入学 时 间 和 所 在 学 院 等 属性 ,用 E-R 图 表示 如 图 1-12 所 示 。 

但 是 有 些 实体 可 具有 多 达 上 百 个 属性 ,因此 在 E-R 图 中 ,实体 型 的 属性 不 可 能 都 直接 
画 出 ,而 通过 数据 字典 的 方式 表示 ( 即 文字 说 明 方式 ,在 5. 2 节 的 数据 字典 中 将 进行 相关 介 
绍 )。 无 论 使 用 哪 种 方法 表示 实体 型 的 属性 ,都 不 能 出 现 遗 漏 属性 的 情况 。 
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1-12 ”学生 实体 及 属性 


(3) 用 菱形 表示 实体 型 间 的 联系 ,菱形 框 内 写 
上 联系 名 ,并 用 无 向 边 分 别 与 有 关 的 实体 型 连接 起 
来 ,同时 在 无 向 边 旁 标 出 联系 的 类 型 (1 : 1,1 : ?或 
m : n)。 如 果 联 系 具 有 属性 , 则 该 属性 仍 用 椭圆 框 
表示 , 仍 需 要 用 无 向 边 将 属性 与 其 联系 连接 起 来 , 需 
要 注意 的 是 ,联系 的 属性 必须 在 E-R 图 上 标识 出 项 目 一 
来 ,不 能 通过 数据 字典 说 明 。 例 如 ,供应 商 、 项 目 和 
零件 之 间 存 在 供应 联系 ,该 联系 的 属性 为 供应 量 , 如 “图 1-13 实体 间 联 系 的 属性 及 其 表示 
图 1-13 所 示 。 

如 图 1-14 所 示 是 概念 模型 的 一 个 E-R 图 示例 。 该 图 反映 了 实体 型 学 生 与 课程 的 属性 
及 其 联系 。 在 此 要 特别 注意 的 是 ,联系 上 也 有 属性 ,如 属性 成 绩 即 不 能 只 属于 学 生 , 也 不 能 
只 属于 课程 ,而 是 学 生 与 课程 之 间 发 生 联系 , 即 学 生 选 某 一 门 课 程 的 结果 , 故 作为 联系 上 的 
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图 1-14 E-R 图 示例 


1.2.3 数据 模型 的 组 成 


模型 是 对 现实 世界 的 抽象 ,在 数据 库 技术 中 ,数据 模型 是 一 组 严格 定义 的 概念 的 集合 。 
这 些 概 念 精确 地 描述 了 系统 的 静态 特性 、 动 态 特 性 和 完整 性 约束 条 件 (Integrity 
Constraints)。 数 据 库 管理 系统 的 一 个 主要 功能 就 是 将 数据 组 织 成 一 个 逻辑 集合 ,为 系统 定 
义 该 集合 的 数据 及 其 联系 的 过 程 称 为 数据 建 模 ,其 使 用 的 技术 工具 则 称 为 数据 模型 。 

数据 模型 是 数据 库 系 统 的 核心 和 基础 。 是 为 了 把 现实 世界 中 的 具体 事物 抽象 .组 织 为 
某 一 DBMS 支持 的 数据 模型 ,各 种 机 器 上 实现 的 DBMS 软件 都 是 基于 某 种 数据 模型 或 者 说 
是 支持 某 种 数据 模型 的 。 

一 个 完整 的 数据 模型 由 三 部 分 组 成 , 即 数 据 结 构 、 数 据 操作 和 完整 性 约束 条 件 。 


1. 数据 结构 

数据 结构 是 数据 模型 最 基本 的 组 成 部 分 。 它 描述 了 数据 库 的 组 成 对 象 以 及 对 象 之 间 的 
联系 ,包括 两 个 方面 的 内 容 : 一 是 描述 了 与 对 象 的 类 型 .内 容 、 性 质 相关 的 ; 二 是 描述 了 数 
据 对 象 之 间 的 相互 联系 。 

在 数据 库 系 统 中 ,通常 人 们 都 是 按照 其 数据 结构 的 类 型 来 命名 数据 模型 的 ,如 层次 结 
构 、 网 状 结构 和 关系 结构 的 数据 模型 分 别 命 名 为 层次 模型 .网 状 模型 和 关系 模型 。 

总 之 ,数据 模型 是 所 描述 的 对 象 类 型 的 集合 , 它 规定 了 数据 模型 的 静态 特性 。 

2. 数据 操作 

数据 操作 是 指 对 数据 库 中 各 种 数据 对 象 允 许 执行 的 操作 集合 。 包 括 操作 及 有 关 的 操作 
规则 两 部 分 内 容 。 

数据 库 中 的 数据 操作 主要 有 数据 查询 和 数据 更 新 ( 即 插入 、 删 除 或 修改 数据 的 操作 ) 两 
大 类 操作 。 

数据 模型 必须 对 数据 库 中 的 全 部 数据 操作 进行 定义 ,指明 每 项 数据 操作 的 确切 含义 、 操 
作对 象 操 作 符号 、 操 作 规则 以 及 对 操作 的 语言 约束 等 。 数 据 操作 是 对 系统 动态 特性 的 
描述 。 

3. 数据 的 完整 性 约束 条 件 

数据 约束 条 件 是 一 组 数据 完整 性 约束 规则 的 集合 。 数 据 完整 性 规则 是 指数 据 模型 中 的 
数据 及 其 联系 所 具有 的 制约 和 依存 规则 。 数 据 约束 条 件 用 以 限定 符合 数据 模型 的 数据 库 状 
态 以 及 状态 的 变化 ,以 保证 数据 库 中 数据 的 正确 有 效 和 相 容 。 

每 种 数据 模型 都 规定 有 基本 的 完整 性 约束 条 件 ,这些 完整 性 约束 条 件 要 求 所 属 的 数据 
模型 都 应 满足 。 同 理 , 每 个 数据 模型 还 规定 了 特殊 的 完整 性 约束 条 件 , 以 满足 具体 应 用 的 
要 求 。 

(1) 通用 的 完整 性 约束 条 件 通常 把 具有 普遍 性 的 问题 归纳 成 一 组 通用 的 约束 规则 ,只 
有 在 满足 给 定 约束 规则 的 条 件 下 才 人 允许 对 数据 库 进 行 更 新 操作 。 例 如 ,关系 模型 中 通用 的 
约束 规则 是 实体 完整 性 和 参照 完整 性 。 

(2) 特殊 的 完整 性 约束 条 件 把 能 够 反映 某 一 应 用 涉及 的 数据 所 必须 遵守 的 特定 的 语义 
约束 条 件 定义 成 特殊 的 完整 性 约束 条 件 。 在 关系 模型 中 特殊 的 约束 规则 是 用 户 定义 的 完 
整 性 。 

例如 ,在 某 大 学 的 数据 库 中 规定 学 生 GPA 达 不 到 2. 0 将 不 能 授予 学 士 学 位 ; 每 个 教师 
每 天 授课 不 能 超过 四 节 ; 男 职工 的 退休 年 龄 是 60 周岁 , 女 职工 的 退休 年 龄 是 55 周岁 等 。 
这 些 约束 条 件 都 是 关系 模型 中 的 特殊 完整 性 约束 条 件 。 

前 面 提 到 ,通常 人 们 都 是 按照 其 数据 结构 的 类 型 来 命名 数据 模型 ,目前 数据 库 领域 常 使 
用 的 数据 模型 有 : 层次 模型 .网 状 模型 和 关系 模型 ; 新 兴 的 数据 模型 有 面向 对 象 数据 模型 
和 对 象 关系 数据 模型 。 


1.2.4 数据 模型 的 分 类 


1. 层次 模型 
层次 模型 (Hierarchical Model) 是 数据 库 系 统 中 最 早出 现 的 且 曾 经 广泛 使 用 的 数据 模 
型 。 在 20 世纪 60 年 代 末 ,层次 模型 数据 库 系统 曾 流行 一 时 ,其 中 最 具 代 表 性 的 是 美国 IBM 
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公司 的 IMS(Information Management Systems) 数 据 库 管 理 系统 。 
1) 层次 数据 模型 的 数据 结构 
它 用 树 形 结构 表示 各 类 实体 集 以 及 实体 集 之 间 的 联系 。 
(1) 层次 模型 的 定义 
在 数据 结构 中 ,定义 满足 下 面 两 个 条 件 的 基本 层次 联系 的 集合 为 层次 模型 。 
@ 有 且 仅 有 一 个 节点 没有 双亲 节点 ,这 个 节点 称 为 根 节点 。 
@ 除根 节点 之 外 的 其 他 节点 有 且 只 有 一 个 双亲 节点 。 
(2) 层次 模型 的 数据 表示 方法 
在 层次 模型 中 规定 : 每 一 个 节点 表示 一 个 记录 类 型 ,记录 类 型 描述 的 是 实体 ; 记录 型 
包含 若干 个 字段 ,字段 用 于 描述 实体 的 属性 。 各 个 记录 类 型 及 其 字段 都 必须 命名 。 各 个 记 
录 类 型 同一 记录 类 型 中 各 个 字段 不 能 同名 。 记 录 值 表示 实体 ; 层次 模型 中 的 每 个 记录 可 
以 定义 一 个 排序 字段 ,排序 字段 也 称 为 码 字 段 ,其 主要 作用 是 确定 记录 的 顺序 。 如 果 排 序 字 
段 的 值 是 唯一 的 , 则 它 能 唯一 地 标识 一 个 记录 值 。 
另外 ,记录 之 间 的 联系 用 节点 之 间 的 连 线 ( 有 向 边 ) 表 示 ,这 种 联系 是 父子 之 间 的 一 对 多 
( 含 一 对 一 ) 的 实体 联系 。 层 次 模型 中 的 同一 双亲 的 子女 
1 节点 称 为 兄弟 节点 (Twin 或 Sibling) ,没有 子女 节点 的 节 
点 称 为 叶 节 点 。 图 1-15 给 出 了 一 个 层次 模型 的 例子 。 


Rs | 兄弟 结 点 | Rs ] 


人 在 图 1-15 中 ,Ri 为 根 节点 ,Rs 和 Rs 都 是 Ri 的 子女 节 
本 i 点 ,Rs 和 Rs 为 兄弟 节点 ,RE 和 Rs 也 为 兄弟 节点 ; Rs、 
rr R, 和 Rs 为 叶子 节点 。 
ee 攻击 如 图 1-16(a) 给 出 了 一 个 教师 -学 生 的 层次 模型 。 它 
图 1-15 一 个 层次 模型 的 示例 。 表示 了 该 层次 数据 库 的 型 ,而 图 1-16(b) 所 示 的 层次 模型 
则 对 应 其 数据 库 的 部 分 值 。 
(3) 多 对 多 联系 在 层次 模型 中 的 表示 
前 面 已 经 说 过 ,层次 数据 模型 只 能 直接 表示 一 对 多 (包括 一 对 一 ) 的 联系 ,但 是 为 了 能 够 
真正 反映 现实 世界 ,那么 另 一 种 常见 联系 方法 , 即 多 对 多 联系 如 何在 层次 模型 中 表示 呢 ? 首 
先 必须 将 多 对 多 联系 分 解 成 一 对 多 联系 。 分 解 的 方法 有 两 种 : 完 余 节点 法 和 虚拟 节点 法 。 
下 面 用 一 个 例子 来 说 明 这 两 种 分 解 方法 。 
如 图 1-17(a) 所 示 ,一 个 含有 多 对 多 联系 的 E-R 图 。 这 是 一 个 简单 的 多 对 多 联系 的 示 
例 , 图 中 有 学 生 和 课程 两 个 实体 集 ,一 个 学 生 可 以 选修 多 门 课程 ,一 门 课 程 可 由 多 个 学 生 选 
修 。 学 生 由 学 号 、 姓 名 和 年 龄 3 个 字段 组 成 .课程 由 课程 号 .课程 名 和 学 分 3 个 字段 组 成 。 
下 面 用 这 个 例子 说 明 多 对 多 联系 的 分 解 方法 。 
图 1-17(b) 采 用 元 余 节 点 法 , 即 通过 增设 两 个 元 余 节 点 将 图 1-17(a) 的 多 对 多 联系 转换 
成 两 个 一 对 多 联系 。 宛 余 节 点 法 的 优点 是 结构 清晰 ,允许 节点 改变 存储 位 置 , 缺 点 是 需要 额 
外 占用 存储 空间 ,有 潜在 的 不 一 致 性 。 
@ 虚拟 节点 分 解法 
图 1-17(c) 采 用 虚拟 节点 的 分 解 方法 ,即将 图 1-17(b) 中 的 元 余 节 点 换 为 虚拟 节点 ,所 
谓 虚 拟 节点 就 是 一 个 指针 (Pointer) ,指向 所 替代 的 节点 。 虚 拟 节 点 法 的 优点 是 减少 对 存储 


学 院 | 学 院 编号 ee 
了 
教研 室 | 教研 室 编号 | 教研 室 名 称 | 教研 室 电话 | ”学 生 | 学 号 | 学 生 姓名 | 年 龄 


职工 号 | 职工 姓名 | 职称 
(@) 教师 -学 生 层次 数据 库 的 型 


学 院 | XX03 EE 


下 
教研 室 | R01 信息 工程 
| Ro2 | 计算 机 科学 | 024-24682015 
通信 工程 [02424682016 


学 生 | 1603030101 上 54 | 18 


024-24682014 | 
| 1603030201 [E | 19 


R03 
R04 | 电子 信息 科学 024-24682017 


E0001 | 赵 ** | 教授 
E0012 | 钱 * * | 讲师 
E0020 | 孙 * * | 副教授 


(b) 教师 -学 生 层次 数据 库 的 部 分 值 
图 1-16 层次 数据 库 的 型 和 值 


学 生 S | 学 号 | 姓名 | 年 龄 | s | 学 号 | 姓名 | 年 龄 | 。 C | 课程 号 | 课程 名 | 学 分 
m 
n 
课程 C | 课程 号 | 课程 名 | 学 分 | C | 课程 号 | 课程 名 | 学 分 | Ss | 学 号 | 姓名 和 四 | 
人 人 
S | 学 号 | 姓名 | 年 办 C | 课程 号 | 课程 名 | 学 分 
Cc S 


(0) 
1-17 用 层次 模型 表示 多 对 多 的 联系 
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空间 的 浪费 ,避免 产生 潜在 的 不 一 致 性 ,缺点 是 节点 改变 存储 位 置 可 能 引起 虚拟 节点 中 指针 
的 修改 。 

2) 层次 模型 的 数据 操作 和 完整 性 约束 条 件 

在 层次 数据 模型 中 ,数据 库 的 基本 操作 包括 数据 记录 的 查询 ,插入 、 删 除 和 修改 等 操作 。 
在 进行 相应 的 操作 时 ,层次 模型 必须 满足 的 完整 性 约束 条 件 如 下 。 

(1) 在 进行 插入 操作 时 ,如 果 没 有 指明 相应 的 双亲 节点 值 , 则 不 能 插入 子女 节点 值 。 例 
如 在 图 1-16(b) 的 层次 数据 库 中 , 若 转学 来 一 个 学 生 , 但 还 没有 为 该 学 生 指明 院 系 , 则 不 能 
将 该 学 生 记 录 插 入 数据 库 中 。 

(2) 在 进行 删除 操作 时 ,如 果 删 除 双 亲 节 点 值 , 则 相应 的 子女 节点 值 也 同时 被 删除 。 例 
如 在 图 1-16(b) 的 层次 数据 库 中 ,车 删除 信息 工程 教研 室 的 节点 , 则 该 教研 室 所 有 教员 的 数 
据 将 全 部 丢失 ; 若 删除 信息 学 院 的 节点 , 则 该 学 院 的 所 有 教研 室 和 学 生 信 息 将 全 部 删除 , 相 
应 的 所 有 教师 信息 也 将 全 部 删除 。 

(3) 在 进行 修改 操作 时 ,应 修改 所 有 相应 记录 ,以 保证 数据 的 一 致 性 。 例 如 ,在 图 1-17(b) 
的 层次 模型 中 ,车 修改 一 个 学 生 的 年 龄 , 则 两 处 学 生 记录 值 的 年 龄 字段 都 要 执行 修改 操作 。 
同样 ,要 增加 一 个 学 生 记 录 值 时 ,也 要 同时 对 两 处 的 学 生 记录 执行 插入 操作 ,结果 不 仅 造成 
操作 麻烦 ,还 特别 容易 引起 数据 不 一 致 的 问题 。 

3) 层次 模型 的 存储 方法 

层次 数据 库 中 不 仅 要 存储 数据 本 身 , 还 要 存储 数据 之 间 的 层次 联系 。 层 次 模型 数据 的 
存储 常常 是 和 数据 之 间 联 系 的 存储 结合 在 一 起 的 。 层 次 模型 数据 的 存储 一 般 使 用 邻接 存储 
法 和 链接 存储 法 两 种 方法 来 实现 。 

(1) 邻接 存储 法 

邻接 存储 法 是 按照 层次 树 前 序 穿越 的 顺序 ,把 所 有 记录 值 依次 邻接 存放 , 即 通 过 物理 空 
间 的 相 邻 位 置 来 安排 (或 隐 含 ) 层 次 顺序 ,实现 存储 。 如 图 1-18(a) 中 的 数据 模型 , 它 的 一 个 
实例 如 图 1-18(b) 所 示 , 则 对 应 的 如 图 1-18(c) 就 是 按 邻 接 法 存放 的 、 以 根 记录 Al 为 首 的 层 
次 记录 实例 集 (为 简单 起 见 , 仅 用 记录 值 的 第 一 个 字段 来 代表 该 记录 值 )。 


A 


: p> 0 
3 B4 


(a) (b) 


Al | Bl | c3 | cs | cy |cl4| B4 | cz | c9 | B6 | c4 | c6 | cg | Az | … 


(©) 
图 1-18 层次 数据 库 邻 接 法 层次 结构 的 实例 
(2) 链接 存储 法 


链接 存储 法 用 指针 来 反映 数据 之 间 的 联系 , 它 包 括 子女 -兄弟 链接 法 和 层次 序列 链接 法 。 
链接 层次 法 是 用 指针 来 反映 数据 之 间 的 层次 联系 ,如 图 1-19 所 示 。 其 中 ,图 1-19(a) 中 


每 个 记录 设 两 类 指针 ,分 别 指向 最 左边 的 子女 (每 个 记录 型 对 应 一 个 ) 和 最 近 的 兄弟 ,因此 这 
种 链接 方法 被 称 为 子女 -兄弟 链接 法 ; 如 图 1-19(b) 是 按 树 的 前 序 穿越 顺序 链接 各 记录 值 ， 


这 种 链接 方法 称 为 层次 序列 链接 法 。 
Al py 二 一 一、 
2 A2|。|。 
pa 
Bl i . 中- 一 ss . 
pe 


. 
1 1 
1 T 
1 1 
1 1 
此 1 4 
C3 C5 C7 Cl4le C2 C9 |。 C4 C6 C8 


(a) 子女 -兄弟 链接 法 


(b) 层次 序列 链接 法 
图 1-19 链接 存储 法 


4) 层次 模型 的 特点 

从 图 1-15 可 以 看 出 层次 模型 像 一 棵 倒立 的 树 ,节点 的 双亲 是 唯一 的 。 图 1-16(a) 是 一 
个 教师 -学 生 层次 模型 的 示例 。 该 层次 模型 有 4 个 记录 型 。 记 录 型 学 院 是 根 节点 ,由 学 院 编 
号 ,学院 名 称 、 办 公 地 点 、 办 公 电 话 4 个 字段 组 成 。 它 有 两 个 子女 节点 教研 室 和 学 生 节点 。 
记录 型 教研 室 是 学 院 的 子女 节点 ,同时 又 是 教师 的 双亲 节点 , 它 由 教研 室 编号 .教研 室 名 称 
和 教研 室 电话 3 个 字段 组 成 。 记 录 型 学 生 由 学 号 、 姓 名 、 年 龄 3 个 字段 组 成 。 记 录 型 教员 由 
职工 号 .职工 姓名 、 职 称 3 个 字段 组 成 。 学 生 与 教师 是 叶子 节点 ,它们 没有 子女 节点 。 由 学 
院 到 教研 室 .由 教研 室 到 教员 由 学 院 到 学 生 均 是 一 对 多 的 联系 。 

而 图 1-16(b) 是 图 1-16(a) 数 据 模 型 对 应 的 一 个 值 。 该 值 是 XX03( 信 息 学 院 ) 记 录 值 及 
其 所 有 后 代 记 录 值 组 成 的 一 棵 树 。 信 息 学 院 有 4 个 教研 室 子女 ,记录 值 分 别 是 R01、R02、 
R03 和 R04 以 及 2 个 学 生 记录 值 1603030101、1603030201。 教 研 室 R01 有 3 个 教员 ,记录 
值 分 别 是 E0001、E0012 和 E0020。 

通过 对 以 上 示例 的 分 析 , 层 次 模型 具有 以 下 几 个 较为 突出 的 问题 。 

(1) 在 层次 模型 中 具有 一 定 的 存 取 路 径 , 需 按 路 径 查 看 给 定 记 录 的 值 。 即 任何 一 个 给 
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定 的 记录 值 只 有 按 其 路 径 查看 时 ,才能 显 出 它 的 全 部 意义 ,没有 一 个 子女 记录 值 能 够 脱离 双 
亲 记 录 值 而 独立 存在 。 

(2) 由 于 层次 数据 模型 中 的 从 属 节点 有 且 仅 有 一 个 双亲 节点 ,因此 它 比较 适合 于 表示 
数据 记录 类 型 之 间 的 一 对 多 联系 ,而 现实 世界 中 很 多 联系 是 非 层 次 性 的 ,如 节点 之 间 具 有 多 
对 多 联系 ,而 对 于 多 对 多 的 联系 难以 直接 表示 , 需 进 行 转换 ,将 其 分 解 成 若干 个 一 对 多 联系 。 

(3) 查询 子女 节点 必须 通过 双亲 节点 。 这 样 对 层次 模型 数据 库 中 的 数据 进行 查询 操作 
时 ,操作 者 必须 了 解数 据 的 层次 结构 ,而且 每 次 操作 只 能 取 一 个 记录 , 若 要 取 多 个 记录 ,必须 
使 用 循环 。 此 外 ,系统 提供 给 用 户 的 数据 库 语言 为 过 程 化 的 语言 ,数据 独立 性 较 差 。 

(4) 由 于 结构 严密 ,层次 命令 趋 于 程序 化 。 

(5) 层次 数据 的 结构 特性 使 得 对 层次 模型 数据 库 进行 插入 、 删 除 、 修 改 操作 时 必须 遵守 
父子 约 东 一致 性 约 东 ,数据 的 型 和 值 需 保持 树 形 结构 等 。 这 样 对 插入 和 删除 操作 的 限制 比 
较 多 ,因此 应 用 程序 的 编写 比较 复杂 。 

虽然 层次 模型 有 以 上 的 问题 或 者 不 足 , 但 是 层次 模型 也 有 其 突出 的 优点 。 

(1) 数据 结构 比较 简单 清晰 ,层次 分 明 ,便于 在 计算 机 内 实现 。 

(2) 查询 效率 高 。 在 层次 模型 中 ,记录 之 间 的 联系 用 有 向 边 表示 ,这 种 联系 通常 通过 指 
针 来 实现 记录 之 间 的 联系 ,因此 这 种 联系 也 就 是 记录 之 间 的 存 取 路 径 。 当 要 存 取 某 个 节点 
的 记录 值 ,DBMS 就 沿 着 这 一 条 路 径 很 快 找到 该 记录 值 ,所 以 ,层次 数据 库 的 性 能 优 于 关系 
数据 库 , 不 低 于 网 状 数据 库 。 从 根 节点 到 树 中 任 一 节点 均 存在 一 条 唯一 的 层次 路 径 , 为 有 效 
地 进行 数据 操纵 提供 了 条 件 。 

(3) 层次 数据 模型 提供 了 良好 的 完整 性 支持 。 

可 见 用 层次 模型 对 具有 一 对 多 层次 联系 的 部 门 描述 非常 自然 直观 ,容易 理解 ,查询 效 
率 高 。 这 些 是 层次 数据 库 的 突出 优点 。 

2. 网 状 模型 

现实 世界 中 广泛 存在 的 事物 及 其 联系 大 都 具有 非 层次 的 特点 ,车 用 层次 结构 来 描述 , 既 
不 直观 ,也 难于 理解 。 于 是 人 们 提出 了 另 一 种 数据 模型 即 网 状 数据 模型 (Network Model) 。 
网 状 数据 库 系统 采用 网 状 模型 作为 数据 的 组 织 方式 。 网 状 数据 模型 的 典型 代表 是 DBTG 
系统 , 亦 称 CODASYL 系统 。 这 是 20 世纪 70 年 代数 据 系 统 语言 研究 会 (Conference 
OnData System Language, CODASYL) 下 属 的 数据 库 任务 组 (Data Base Task Group， 
DBTG) 提 出 的 一 个 系统 方案 ,该 方案 代表 着 网 状 模型 的 诞生 。DBTG 系统 虽然 不 是 实际 的 
数据 库 系统 软件 ,但 是 它 提出 的 基本 概念 方法 和 技术 具有 普遍 意义 。 它 对 于 网 状 数 据 库 系 
统 的 研制 和 发 展 起 了 重大 的 影响 。 后 来 不 少 的 系统 都 采用 DBTG 模型 或 者 简化 的 DBTG 
模型 。 例 如 , 较 著 名 的 有 Computer Associates International 公司 的 IDMS、 Cullinet 
Software 公司 的 IDMS、 Univac 公司 的 DMS1100、Honeywell 公司 的 IDS/2、HP 公司 的 
IMAGE 等 。 

网 状 模型 是 一 个 图 结构 , 它 是 由 字段 (属性 )、 记 录 类 型 (实体 型 ) 和 系 (set) 等 对 象 组 成 
的 网 状 结构 的 模型 。 从 图 论 的 观点 看 , 它 是 一 个 不 加 任何 条 件 的 有 向 图 。 

1) 网 状 模型 的 数据 结构 

(1) 网 状 模型 的 定义 

在 数据 库 中 ,把 满足 以 下 三 个 条 件 的 基本 层次 联系 的 集合 称 为 网 状 模型 ; 


@ 允许 有 一 个 以 上 的 节点 没有 双亲 ; 

@ 至 少 有 一 个 节点 可 以 有 多 于 一 个 的 双亲 ; 

@ 允许 两 个 节点 之 间 有 两 种 或 两 种 以 上 的 关系 。 
图 1-20 中 的 (a)、(b) 和 (c) 图 都 是 网 状 模型 的 例子 。 


RI R2 | RI RI R2 
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图 1-20 网 状 模型 的 例子 


从 网 状 模型 的 例子 可 以 看 出 , 它 去 掉 了 层次 模型 的 两 个 限制 ,允许 多 个 节点 没有 双亲 节 
点 ,同时 也 允许 节点 有 多 于 一 个 的 双亲 节点 。 此 外 它 还 允许 两 个 节点 之 间 有 多 种 联系 ( 称 之 
为 复合 联系 )。 因 此 ,网 状 模型 是 比 层次 模型 更 具 普遍 性 的 结构 。 而 层次 模型 实际 上 是 网 状 
模型 的 一 个 特例 ,网 状 模型 是 层次 模型 的 一 般 形 式 。 网 状 模型 可 以 更 直接 地 描述 现实 世界 。 

(2) 网 状 模型 的 数据 表示 方法 

O@ 同 层 次 模型 一 样 ,网 状 模型 也 使 用 记录 和 记录 值 表示 实体 集 和 实体 ; 网 状 模型 中 每 
个 节点 表示 一 个 记录 类 型 (实体 ) ,每 个 记录 类 型 可 包含 若干 个 字段 (实体 的 属性 )。 

@ 从 定义 可 以 看 出 ,层次 模型 中 子女 节点 与 双亲 节点 的 联系 是 唯一 的 ,而 在 网 状 模型 
中 这 种 联系 可 以 是 不 唯一 ,因此 ,要 为 每 个 联系 命名 。 网 状 模型 中 的 联系 用 节点 之 间 的 连 线 
表示 ,每 个 有 向 线段 表示 一 对 记录 间 的 一 对 多 的 父子 联系 。 由 于 网 状 模型 中 的 联系 比较 复 
杂 , 所 以 网 状 模型 中 的 联系 简称 为 系 。 另 外 两 个 记录 之 间 可 以 存在 多 种 联系 , 且 一 个 记录 多 
许 有 多 个 双亲 记录 ,所 以 网 状 模型 中 的 系 必须 命名 ,用 系 名 标识 不 同 的 联系 。 例 如 ,图 1-20(a) 
中 R3 有 两 个 双亲 记录 R1 和 R2 ,因此 我 们 把 R1 与 R3 之 间 的 联系 命名 为 L1,R2 与 R3 之 
间 的 联系 命名 为 L2。 另 外 ,网 状 模型 中 还 允许 有 复合 链 , 即 两 个 记录 间 可 以 有 两 种 以 上 的 
联系 ,如 图 1-20(b) 所 示 。 

下 面 以 学 生 选 课 为 例 , 看 一 看 网 状 模型 的 数据 库 是 怎样 来 组 织 数据 的 。 

按照 语义 ,一 个 学 生 可 以 选修 多 门 课 程 , 某 一 课程 可 以 被 多 名 学 生 选 修 ,因此 学 生 与 课 
程 之 间 的 联系 是 多 对 多 的 。 由 于 网 状 模型 中 不 能 表示 实体 之 间 多 对 多 的 联系 。 因 此 这 样 的 
实体 联系 图 不 能 直接 用 网 状 模型 来 表示 。 为 此 引进 一 个 学 生 选 课 的 联结 记录 , 它 由 3 个 数 
据 项 组 成 , 即 学 号 .课程 号 .成 绩 ,表示 某 个 学 生 选 修 某 一 门 课程 及 其 成 绩 。 

这 样 ,学 生 选 课 数据 库 包 括 3 个 记录 : 学 生 、 课 程 和 选课 。 

每 个 学 生 可 以 选修 多 门 课程 ,显然 对 学 生 记录 中 的 一 个 值 , 选 课 记 录 中 可 以 有 多 个 值 与 
之 联系 ,而 选课 记录 中 的 一 个 值 , 只 能 与 学 生 记 录 中 的 一 个 值 联系 。 学 生 与 选课 之 间 的 联系 
是 一 对 多 的 联系 ,联系 名 为 SSC。 同 样 , 课 程 与 选课 之 间 的 联系 也 是 一 对 多 的 联系 ,联系 名 
为 C-SC。 如 图 1-21 所 示 为 学 生 选 课 数据 库 的 网 状 数据 模型 。 

2) 网 状 模型 的 数据 操作 与 完整 性 约束 条 件 

网 状 模型 的 数据 操作 包括 查询 ,插入 、 删 除 和 修改 等 操作 ,使 用 的 是 过 程 化 语言 。 
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学 生 S | 学 号 | 姓名 | 年 龄 课程 C | 课程 号 | 课程 名 | 学 分 


S-SC l | C-SC 


选课 SC| 学 号 [ws 成 绩 


(a) 学 生 -选课 -课程 网 状 数据 库 模型 


Sl | …: GIT a 
学 生 S | S2 | …. 课程 C QT 


S3 nk G3 
s4 | …- 

一 一 一 

选课 [| SI [| C1 | 90 
sll 


s4TcT%] 
SL | cs | s0 


(b) 学 生 -选课 -课程 网 状 数据 库 的 值 
图 1-21 学 生 -选课 -课程 的 网 状 数据 模型 例子 


网 状 数据 模型 记录 之 间 的 联系 比较 复杂 。 网 状 模型 一 般 来 说 没有 层次 模型 那样 严格 的 
完整 性 约束 条 件 , 但 具体 的 网 状 数据 库 系统 对 数据 操纵 都 加 了 一 些 限 制 ,提供 了 一 定 的 完整 
性 约束 。 

例如 DBTG 在 模式 DDL 中 ,提供 了 定义 DBTG 数据 库 完整 性 的 若干 个 概念 和 语句 。 

(1) 支持 记录 “ 码 ” 的 概念 。“ 码 ” 即 唯一 标识 记录 的 数据 项 的 集合 。 例 如 ,学 生 记 录 ( 如 
图 1-21) 中 学 号 就 是 码 , 因 此 在 学 生 数 据 库 中 不 允许 学 生 记 录 中 有 重复 的 学 号 值 出 现 。 

(2) 保证 一 个 联系 中 双亲 记录 和 子女 记录 之 间 的 联系 是 一 对 多 的 。 

(3) 可 以 支持 双亲 记录 和 子女 记录 之 间 某 些 约束 条 件 。 例 如 ,有 些 子 女 记录 要 求 双 亲 
记录 存在 时 才能 插入 ,双亲 记录 删除 时 子女 记录 也 连同 删除 。 例 如 图 1-21 中 选课 记录 就 应 
该 满足 这 种 约 东 条 件 ,学 生 选 课 记 录 值 必须 是 数据 库 中 已 经 存在 的 某 一 学 生 选 修了 已 经 存 
在 某 一 门 课 的 记录 。 

3) 网 状 模型 的 存储 结构 

由 于 网 状 模型 记录 之 间 的 联系 比较 复杂 ,因而 网 状 数据 模型 的 存储 结构 中 关键 是 如 何 
实现 记录 之 间 的 联系 。 网 状 数据 模型 常用 的 存储 方法 是 链接 法 , 它 包 括 单 向 链接 、 双 向 链 
接 、 环 状 链接 .向 首 链接 等 。 此 外 ,网 状 数据 模型 还 有 其 他 的 存储 方法 ,如 二 进 制 阵列 法 、 索 
引 法 ,指引 元 阵列 法 等 ,一 般 依 具体 系统 的 不 同 而 采取 不 同 的 存储 方法 。 

4) 网 状 数据 模型 的 主要 优 缺 点 

网 状 数据 模型 的 主要 优点 。 

(1) 能 够 更 直接 地 描述 现实 世界 ,一 个 节点 可 以 有 多 个 双亲 ; 节点 之 间 可 以 有 多 种 联 
系 , 即 允 许 复合 链 。 


(2) 存 取 效 率 比 较 高 ,具有 良好 的 性 能 。 

网 状 数据 模型 的 主要 缺点 。 

(1) 结构 比较 复杂 ,而 且 随 着 应 用 环境 的 扩大 ,数据 库 的 结构 变 得 越 来 越 复杂 ,不 利于 
用 户 掌 握 。 

(2) 网 状 模型 的 DDL 和 DML 语言 复杂 ,并 且 要 嵌入 某 一 种 高 级 语言 (如 COBOL 语言 
或 C 语言 ) 中 ,用 户 不 容易 掌握 和 使 用 。 

(3) 数据 的 独立 性 较 差 。 这 是 由 于 记录 之 间 的 联系 是 通过 存 取 路 径 实现 的 ,应 用 程序 
在 访问 数据 时 必须 选择 适当 的 存 取 路 径 , 因 此 ,程序 员 要 为 访问 数据 设置 存 取 路 径 , 用 户 必 
须 了 解 系统 结构 的 细节 后 才能 实现 其 数据 存 取 工作 ,加 重 了 编写 应 用 程序 的 负担 。 

3. 关系 模型 

关系 模型 (Relational Model) 是 目前 最 重要 的 一 种 数据 模型 。 关 系数 据 库 系统 采用 关 
系 模型 作为 数据 的 组 织 方式 ,现在 流行 的 数据 库 系统 大 都 是 关系 数据 库 系统 。 美 国 IBM 公 
司 的 研究 员 E. F. Codd 于 1970 年 发 表 了 题 为 (大 型 共享 系统 的 关系 数据 库 的 关系 模型 ) 的 
论文 ,首次 提出 了 数据 库 系统 的 关系 模型 ,开创 了 数据 库 关系 方法 和 关系 数据 理论 的 研究 ， 
为 数据 库 技术 奠定 了 理论 基础 。 关 系 模型 的 建立 ,是 数据 库 历史 发 展 中 最 重要 的 事件 。 

自 20 世纪 80 年 代 以 来 ,数据 库 系 统 研究 都 是 围绕 着 关系 模型 进行 的 。 数 据 库 领域 当 
前 的 研究 工作 也 都 是 以 关系 方法 为 基础 。 因 此 本 书 的 重点 也 将 放 在 关系 数据 库 上 ,本 书 的 
以 下 各 章 将 详细 介绍 关系 数据 库 系统 。 

1) 关系 数据 模型 的 数据 结构 

(1) 关系 模型 的 定义 

关系 模型 与 其 他 的 数据 模型 不 同 , 它 建立 在 严格 的 数学 概念 的 基础 上 。 严 格 的 定义 将 
在 第 2 章 给 出 。 这 里 只 简单 描述 一 下 关系 模型 。 

关系 模型 的 数据 结构 是 由 若干 关系 模式 组 成 的 。 关 系 模式 相当 于 层次 模型 和 网 状 模 型 
中 的 记录 类 型 ( 即 节点 )。 关 系 模式 的 实例 称 为 关系 ,每 一 个 关系 的 数据 结构 是 一 张 规范 化 
的 二 维 表 , 它 表示 不 同 的 实体 集 及 实体 集 之 间 的 联系 。 在 关系 模型 中 ,通常 把 二 维 表 称 为 关 
系 ,一般 的 二 维 表 都 是 由 多 行 和 多 列 组 成 。 每 一 行 称 为 一 个 元 组 ,元 组 用 主 码 标识 ; 每 一 列 
称 为 一 个 属性 , 列 中 的 值 取 自 相 应 的 域 , 域 是 属性 所 有 可 能 取 值 的 集合 。 目 前 大 多 数 DBMS 
都 是 基于 关系 模型 的 。 

(2) 关系 模型 的 数据 表示 

与 层次 和 网 状 模型 不 同 , 在 关系 模型 中 ,实体 集 之 间 的 联系 是 通过 二 维 表 结构 表示 的 。 
此 外 , 表 之 间 还 有 型 和 值 的 隐 式 联系 (用 于 完整 性 约束 和 关联 查询 ) , 均 不 需 人 为 设置 指针 。 
如 图 1-22 所 示 ,曲线 表示 隐 式 联系 。 

图 1-22 给 出 了 一 个 关系 模型 的 数据 结构 示例 ,对 应 于 图 1-14 所 示 的 E-R 图 ,描述 了 学 
生 实 体 \ 课 程 实体 以 及 两 者 之 间 选 课 的 多 对 多 联系 ,该 关系 模型 包括 3 个 关系 模式 (为 描述 
方便 ,属性 名 有 删 减 ) : 

学 生 ( 学 号 ,姓名 ,性 别 , 出 生日 期 ,学 院 名 称 ) 


课程 (课程 号 ,课程 名 ,学 分 ) 
选课 (学 号 ,课程 号 ,成 绩 ) 


对 应 于 图 1-14 所 示 的 E-R 图 ,在 关系 模型 中 ,学 生 和 课程 实体 分 别 转换 为 关系 模式 的 
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学 院 名 称 


学 生 卫 姓名 | 性 别 | 出 生日 期 


\ | 


选课 十 学 号 | 课程 号 | 成 绩 
| 一 一 


课程 | 课 课程 名 | 学 分 


1-22 关系 模型 的 数据 结构 


学 生 和 课程 ,多 对 多 联系 “学 生 与 课程 ”转换 为 关系 模式 的 选课 。 在 关系 模式 中 , 带 有 下 面 线 
的 属性 是 主 码 , 即 唯一 标识 元 组 的 一 个 最 小 属性 集 。 表 示 实 体 的 关系 模式 学 生 和 课程 的 主 
码 分 别 是 “学 号 ”和 “课程 号 ”; 而 表示 多 对 多 联系 的 关系 模式 选课 的 主 码 是 “学 号 , 课 号 ”, 即 
两 个 属性 联合 作为 主 码 ,因为 只 有 同时 给 出 哪个 学 生 选 了 哪 门 课程 ,才能 唯一 标识 一 个 选课 
元 组 


关系 模式 选课 的 “学 号 ”属性 参照 关系 模式 学 生 的 主 码 “ 学 号 ”, 表 示 哪 个 学 生 选 课 ; 关 
系 模式 选课 的 “课程 号 ”属性 参照 关系 模式 课程 的 主 码 “ 课 程 号 ”, 表 示 选 了 哪 门 课程 。 
现在 以 图 1-23 所 示 的 关系 模型 的 数据 实例 为 例 ,介绍 关系 模型 中 的 一 些 常用 术语 。 


学 生 | 学 号 | 姓名 | 性 别 | 出 生日 期 | 学 院 名 称 
18030301 | 张 三 男 |2000-02-19 信息 


18030302 | 李 四 | 女 |2000-12-09| 信息 


选课 | 学 号 | 课程 号 | 成 绩 课程 | 课程 号 | ”课程 名 | 学 分 
18030301| 1 | 92 1 | 高 等 数学 | 6 
18030302| 2 | 85 [2 | 数据库 原理 | 2 


18030303| 3 | 9 


图 1-23 关系 模型 的 数据 实例 


@ 关系 (Relation) : 一 个 关系 对 应 通常 说 的 一 张 表 ,如 图 1-23 所 示 的 这 张 学 生 表 就 是 
学 生 关 系 。 

@@ 元 组 (Tuple): 表 中 的 一 行 即 为 一 个 元 组 ,描述 一 个 具体 实体 ,在 关系 数据 库 中 称 为 

@ 属性 (Attribute) : 表 中 的 一 列 即 为 一 个 属性 。 一 个 表 中 往往 有 多 个 属性 ,为 了 区 分 
这 些 属性 ,要 给 每 一 个 属性 起 一 个 不 同 的 名 称 即 属 性 名 。 如 ,学 生 关 系 中 ,属性 有 学 号 、 姓 
名 等 。 


图 码 (Key) 也 称 为 码 键 。 表 中 的 某 个 属性 或 属性 组 , 它 可 以 唯一 确定 一 个 元 组 ,如 
图 1-23 中 的 学 生 关系 中 的 学 号 ,可 以 唯一 确定 一 个 学 生 , 也 就 成 为 本 关系 的 码 ; 而 选课 关 
系 中 的 码 是 (学 号 和 课程 号 ) 属 性 组 ,这 是 因为 这 个 关系 中 只 有 这 两 个 属性 才能 唯一 决定 某 


一 个 学 生 选 了 某 一 门 课程 的 成 绩 。 


@ 域 (Domain) : 属性 的 取 值 范围 ,如 人 的 年 龄 一 般 为 1 一 150 岁 , 大 学 生年 龄 属性 的 域 
的 取 值 范围 为 是 10 一 30, 性 别 的 域 是 男 或 女 ,学 院 名 称 的 域 是 一 个 学 校 所 有 学 院 名 称 的 集 


合 等 。 


@ 分 量 (Element) : 元 组 中 的 一 个 属性 值 。 
@ 关系 模式 (Relation Model) : 是 对 关系 的 描述 ,一 般 表 示 为 


关系 名 (属性 1, 属性 2, … ,属性 n) 
例如 ,如 图 1-22 的 关系 可 描述 为 : 
学 生 (学 号 ,姓名 ,性 别 ,出 生日 期 ,学 院 名 称 ) 


课程 (课程 号 ,课程 名 ,学 分 ) 


在 关系 模型 中 ,实体 以 及 实体 间 的 联系 都 是 用 关系 来 表示 的 。 例 如 : 学 生 与 课程 之 间 
的 多 对 多 联系 (学 生 选 课 ) 在 关系 模型 中 可 以 表示 如 下 : 


选课 (学 号 ,课程 号 ,成 绩 ) 


男 外 ,关系 模型 要 求 关系 必须 是 规范 化 的 。 所 谓 关 系 规范 化 是 指 关 系 模式 要 满足 一 定 
的 规范 条 件 。 关 系 的 规范 条 件 很 多 ,但 首要 条 件 是 关系 的 每 一 个 分 量 必须 是 不 可 分 的 数据 
项 。 也 就 是 说 ,不 允许 表 中 还 有 表 。 如 图 1-24 中 工资 和 扣除 是 可 分 的 数据 项 ,工资 又 分 为 : 
岗位 工资 , 薪 级 工资 .基础 绩效 ,岗位 津贴 和 科教 奖励 ,扣除 又 分 为 医保 ,公积金 . 扣 税 和 保 
险 。 因 此 ,图 1-24 的 表 就 不 符合 关系 模型 要 求 ,是 一 个 非 规范 化 关系 。 


工资 扣除 
I 岗位 | 薪 级 | 基础 | 岗位 | 科教 公 
要 工资 | 工资 绩效 | 津贴 奖励 | 区 保 | 如 | 扣 税 | 保险 


实 
发 


涉 峡 


图 1-24 一 个 非 规范 化 关系 的 示例 


2) 关系 模型 的 数据 操作 和 关系 的 完整 性 约束 条 件 
关系 模型 的 数据 操作 主要 包括 数据 查询 、 插 入、 删除 、 修 改 数据 。 关 系 中 的 数据 操作 是 
集合 操作 ,操作 的 对 象 和 操作 结果 都 是 关系 , 即 若干 元 组 的 集合 ,而 不 是 单 记录 的 操作 方式 。 
此 外 ,关系 操作 语言 都 是 高 度 非 过 程 的 语言 ,由 于 关系 模型 把 存 取 路 径 对 用 户 隐 蔽 起 来 了 ， 
用 户 在 操作 时 ,只 要 指出 “干什么 ”或 “ 找 什 么 ”, 而 不 必 详 细 说 明 “ 怎 么 干 ” 或 “怎么 找 ”。 使 得 
数据 的 独立 性 大 大 提高 了 。 由 于 关系 语言 的 高 度 非 过 程 化 使 得 用 户 对 关系 的 操作 变 得 容 


易 , 提 高 了 系统 的 效率 。 


以 上 操作 必须 满足 关系 的 完整 性 约束 条 件 。 关 系 的 完整 性 约束 条 件 包括 3 类 : 实体 完 
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整 性 参照 完整 性 和 用 户 定 义 的 完整 性 。 完 整 性 的 具体 内 容 将 在 第 2 章 作 详细 的 介绍 。 

3) 关系 模型 的 存储 结构 

在 关系 模型 的 物理 存储 结构 中 ,关系 以 文件 形式 存储 。 一 些小 型 的 关系 数据 库 管理 系 
统 (RDBMS) 采 用 直接 利用 操作 系统 文件 的 方式 实现 关系 存储 ,一 个 关系 对 应 一 个 数据 文 
件 。 为 了 提高 系统 性 能 ,许多 关系 数据 库 管理 系统 采用 自己 设计 的 文件 结构 文件 格式 和 数 
据 存 取 机 制 进行 关系 存储 ,以 保证 数据 的 物理 独立 性 和 逻辑 独立 性 ,更 有 效 地 保证 数据 的 安 
全 性 和 完整 性 。 

在 关系 数据 模型 中 ,实体 及 实体 间 的 联系 都 用 二 维 表 来 表示 。 在 关系 数据 库 的 物理 组 
织 中 ,有 的 DBMS 一 个 表 对 应 一 个 操作 系统 文件 ,有 的 DBMS 从 操作 系统 获得 若干 大 的 文 
件 ,自己 设计 表 、 索 引 等 存储 结构 。 

4) 关系 数据 模型 的 特点 

关系 数据 模型 具有 下 列 优点 。 

(1) 关系 模型 与 非 关系 模型 不 同 , 它 是 建立 在 严格 的 数学 概念 的 基础 上 的 ,有 较 强 的 理 
论 基础 。 关 系 及 其 系统 的 设计 和 优化 有 数学 理论 指导 ,容易 实现 且 性 能 较 好 。 

(2) 关系 数据 模型 的 概念 单一 ,容易 理解 。 在 关系 模型 中 ,无论 是 实体 还 是 实体 之 间 的 
联系 ,无 论 是 操作 对 象 还 是 操作 结果 ,都 用 关系 来 表示 。 对 数据 的 检索 和 更 新 结果 也 是 关系 
( 即 表 )。 这 种 概念 单一 的 数据 结构 ,使 数据 操作 方法 统一 ,也 使 用 户 易 懂 易 用 。 

(3) 数据 的 独立 性 和 安全 保密 性 都 较 好 。 由 于 关系 模型 的 存 取 路 径 对 用 户 透 明 , 从 而 
具有 更 高 的 数据 独立 性 、 更 好 的 安全 保密 性 ,也 减轻 了 程序 员 开 发 数据 库 工作 的 强度 。 

(4) 可 用 关系 直接 表示 多 对 多 的 联系 。 

(5) 描述 的 一 致 性 。 不 仅 实体 用 关系 描述 ,实体 之 间 的 联系 也 用 关系 描述 。 

关系 数据 模型 具有 下 列 缺 点 : 

(1) 关系 模型 中 的 数据 联系 是 靠 数据 完 余 实现 的 ,关系 数据 库 中 不 可 能 完全 消除 数据 
元 余 。 
(2) 由 于 存 取 路 径 对 用 户 透明 ,查询 效率 往往 不 如 非 关 系 模型 。 因 此 为 了 提高 性 能 ， 
DBMS 必须 对 用 户 的 查询 请 求 进行 优化 ,因此 增加 了 开发 DBMS 的 难度 。 不 过 ,用 户 不 必 
考虑 这 些 系 统 内 部 的 优化 技术 细节 。 

在 关系 模型 发 展 的 早期 ,关系 模型 还 有 一 些 质 疑 的 声音 之 外 ,这 些 声音 主要 来 自 性 能 方 
面 ,主要 源 于 元 组 之 间 没 有 直接 的 指针 链接 、 存 取 路 径 又 对 用 户 透 明 ,查询 效率 往往 不 如 层 
次 、 网 状 模型 。 但 随 着 关系 模型 查询 优化 技术 的 完善 和 计算 机 硬件 性 能 的 提高 ,目前 关系 模 
型 的 效率 基本 接近 层次 模型 .网 状 模型 。 在 实际 应 用 中 ,一 般 无 须 考虑 关系 模型 的 性 能 问 
题 。 所 以 关系 数据 模型 诞生 以 后 发 展 迅速 , 深 受 用 户 的 喜爱 。 

4. 其 他 数据 模型 

从 数据 库 的 发 展 历程 来 看 ,层次 模型 .网 状 模型 和 关系 模型 是 使 用 比较 广泛 的 数据 模 
型 。 其 中 20 世纪 80 年 代 后 期 关系 模型 已 渐渐 成 为 最 主要 的 数据 模型 。 除 了 上 述 3 种 数据 
模型 以 外 ,还 有 其 他 一 些 数据 模型 也 在 特定 的 领域 发 挥 着 重要 的 作用 ,下 面 简单 介绍 其 他 的 
数据 模型 。 

1) 面向 对 象 数据 模型 

面向 对 象 数据 模型 (ObjectOriented Data Model,.OO) 是 用 面向 对 象 的 方法 来 描述 现 


实 世 界 对 象 的 逻辑 组 织 、 对 象 间 限 制 、 联 系 等 的 模型 。 面 向 对 象 模型 用 类 表示 实体 集 ,用 对 
象 表示 实体 ,用 对 象 间 的 关联 表示 实体 间 的 联系 。 对 象 作为 描述 信息 实体 的 统一 概念 ,把 数 
据 和 对 数据 的 操作 融 为 一 体 ,通过 类 继承 封装 和 实例 化 机 制 来 构造 基于 面向 对 象 数 据 模 
型 的 软件 系统 。 面 向 对 象 数据 模型 是 随 着 面向 对 象 方法 论 应 用 于 数据 库 领 域 而 产生 的 。 支 
持 面 向 对 象 数据 模型 的 数据 库 管理 系统 简称 
OODBMS (Object-Oriented Database Management 
System)。 | 


面向 对 象 数据 模型 中 ,类 的 子 集 称 为 该 类 的 子 | 加 区 | | 怎 区 | | 多 边 形 
类 ,该 类 称 为 子 类 的 父 类 或 超 类 。 子 类 可 继承 父 类 的 
所 有 属性 和 方法 。 子 类 还 可 以 有 子 类 ,形成 一 个 类 层 三 角形 四 边 形 
次 结构 ,如 图 1-25 所 示 。 
(1) 面向 对 象 数 据 模型 的 三 个 要 素 不 等 边 | | 等 腰 萎 形 
GD 数据 结构 : 为 对 象 类 层次 ( 含 嵌 套 ) 结 构 。 其 
描述 工具 是 对 象 .类 和 继承 ,其 对 应 的 约束 条件 可 以 等 边 | | 正方 形 


包括 每 一 个 对 象 具 有 唯一 的 由 系统 定义 的 标识 ,每 一 
个 对 象 标识 仅 标识 一 个 对 象 。 

@ 数据 操作 : 包括 与 对 象 相关 的 方法 。 使 用 对 象 查询 语言 进行 多 种 对 象 操作 ,包括 定 
义 类 (属性 、 操 作 、 继 承 性 \ 约 束 ) ,创建 对 象 及 操纵 (生成 . 存 取 \ 修 改 、 删 除 等 )。 

人 数据 的 完整 性 约束 : 有 类 与 对 象 的 唯一 性 约束 、 父 子 约束 、 引 用 存在 性 约束 等 。 

(2) 面向 对 象 模型 的 核心 技术 

Oa 分 类 。 分 类 是 把 一 组 具有 相同 属性 结构 和 操作 方法 的 对 象 归纳 或 映射 为 一 个 公共 
类 的 过 程 。 

@ 概括 。 概 括 是 把 几 个 类 中 某 些 具有 部 分 公共 特征 的 属性 和 操作 方法 抽象 出 来 ,形成 
一 个 更 高 层次 .更 具 一 般 性 的 超 类 的 过 程 。 

@ 聚集 ,聚集 是 将 几 个 不 同类 的 对 象 组 合成 一 个 更 高 级 的 复合 对 象 的 过 程 。 

2) 对 象 关系 模型 

对 象 关 系 模型 (Object-Relational Model) 是 关系 模型 与 面向 对 象 模型 的 结合 ,在 关系 
模型 的 基础 上 扩充 了 类 、 对 象 . 继 承 等 面向 对 象 概念 。 关 系 模型 提供 的 基本 数据 类 型 是 
有 限 的 ,而 对 象 关系 模型 允许 用 户 以 基本 数据 类 型 为 基础 ,自己 定义 新 的 数据 类 型 .函数 
和 操作 符 。 用 户 自 定义 的 数据 类 型 和 函数 (操作 符 也 是 一 种 函数 ) 在 概念 上 相当 于 类 ,而 
定义 数据 类 型 的 值 相当 于 对 象 ,同时 可 以 支持 自 定义 数据 类 型 间 的 继承 。 支 持 对 象 关 系 
模型 的 数据 库 管 理 系 统 简 称 为 ORDBMS (Object-Relational Database Management 
System) 。 


图 1-25 类 层次 结构 示例 


1.3 数据 库 系 统 的 结构 


从 数据 库 管理 系统 角度 看 ,数据库 系统 通常 采用 三 级 模式 结构 , 即 外 模式 、 模 式 和 内 模 
式 。 这 是 数据 库 管 理 系统 内 部 的 系统 结构 。 任 何 一 个 DBMS 都 应 该 支持 三 级 模式 的 定义 。 
本 节 将 介绍 数据 库 系 统 的 模式 结构 。 
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1.3.1 数据 库 系统 模式 的 概念 


在 数据 模型 中 有 “型 "(Type) 和 “ 值 ”"(Value) 的 概念 。 型 是 指 对 某 一 类 数据 的 结构 和 属 
性 的 说 明 , 而 值 是 对 型 的 一 个 具体 赋值 。 例 如 ,学 生 记 录 其 型 定义 为 (学 号 、 姓 名 、 性 别 、 出 生 
年 月 、 所 在 院 系 、 和 人 学 时 间 ,家庭 住址 ) 等 属性 组 成 ,而 (1703070101, 李 艺 、 女 ,199905 ,信息 科 
学 与 工程 学 院 ,2017 ,辽宁 省 沈阳 市 ) 则 是 该 记录 型 的 一 个 记录 值 。 

模式 (Schema) 是 数据 库 中 全 体 数 据 的 逻辑 结构 和 特征 的 描述 。 它 仅仅 涉及 型 的 描 
述 , 而 不 考虑 具体 的 值 。 模 式 的 一 个 具体 值 称 为 模式 的 一 个 实例 (Instance) 。 同 一 个 模式 
可 以 有 很 多 实例 。 模 式 是 相对 稳定 的 ,而 实例 是 相对 变化 的 ,因为 数据 库 中 的 数据 在 不 
断 地 更 新 。 模 式 反 映 的 是 数据 的 结构 及 其 联系 ,而 实例 反映 的 是 数据 库 某 一 时 刻 的 

例如 某 高 校 2017 年 共有 在 校 学 生 15000 名 , 共 开 设 500 课程 。 在 学 生 选 课 数 据 库 模式 
中 ,包含 学 生 记录 .课程 记录 和 学 生 选 课 记 录 , 则 2017 年 有 一 个 学 生 数 据 库 的 实例 ,该 实例 
包含 了 2017 年 学 校 中 所 有 学 生 的 记录 (共有 15000 个 学 生 记 录 ) 及 学 校 开 设 的 500 门 课程 
的 记录 和 所 有 学 生 选 课 的 记录 。 

2016 年 度 学 生 数据 库 模 式 对 应 的 实例 与 2017 年 度 学 生 数据 库 模 式 对 应 的 实例 是 不 同 
的 。 实 际 上 2017 年 度 学 生 数据 库 的 实例 也 会 随 着 时 间 的 变化 而 变化 ,因为 在 此 年 度 有 的 学 
生 可 能 退学 ,有 的 学 生 降 级 ,也 可 能 转 专业 ,有 的 学 生 可 能 退 课 。 因 此 学 生 数 据 库 和 选课 数 
据 库 的 实例 在 各 个 时 刻 是 变化 的 ,而 数据 库 模式 基本 保持 不 变 。 

虽然 实际 的 数据 库 管 理 系 统 产品 种 类 很 多 ,它们 支持 不 同 的 数据 模型 ,使 用 不 同 的 数据 
库 语 言 , 建 立 在 不 同 的 操作 系统 之 上 ,数据 的 存储 结构 也 各 不 相同 。 但 它们 在 体系 结构 上 通 
常 都 具有 相同 的 特征 , 即 一 般 都 采用 三 级 模式 结构 (早期 微机 上 的 小 型 数据 库 系统 除外 )。 
所 谓 三 级 模式 结构 是 指数 据 库 系统 是 由 外 模式 、 模 式 和 内 模式 三 级 构成 的 ,并 提供 两 级 映像 
功能 ,如 图 1-26 所 示 。 


应 用 1 应 用 2 应 用 3 |.… | 应 用 m 
用 户 级 外 模式 1 外 模式 2 |… | 外 模式 n 


1-26 数据库 系统 的 三 级 模型 结构 


下 面 分 别 介绍 数据 库 系统 的 三 级 模式 及 两 级 映像 功能 。 
1.3.2 数据 库 系统 的 三 级 模式 结构 


1. 模式 

定义 : 模式 (Schema) 又 称 为 概念 模式 (Conceptual Schema) 或 逻辑 模式 (Logical 
Schema) 。 是 数据 库 中 全 部 数据 的 逻辑 结构 和 特征 的 描述 ,是 系统 为 了 减少 数据 元 余 , 实 现 
数据 共享 的 目标 ,并 对 所 有 用 户 的 数据 进行 综合 抽象 而 得 到 的 公共 数据 视图 。 

模式 处 于 数据 库 三 级 模式 中 的 核心 位 置 , 它 独立 于 数据 库 的 其 他 层次 ,设计 数据 库 模 式 
结构 时 应 首先 确定 数据 库 的 逻辑 模式 。 既 不 涉及 数据 的 物理 存储 细节 和 硬件 环境 ,也 与 具 
体 的 应 用 程序 和 编程 语言 无 关 。 

实际 上 ,模式 统一 综合 考虑 了 所 有 用 户 的 需求 ,并 将 这 些 需求 有 机 地 组 成 一 个 迎 辑 整 
体 。 它 采用 DBMS 支持 的 数据 模型 定义 要 存储 到 数据 库 中 的 数据 。 

说 明 : 

Oa 一 个 数据 库 只 有 一 个 模式 。 

@ 模式 是 数据 库 数据 在 概念 级 上 的 视图 。 模 式 与 具体 的 应 用 程序 无 关 , 它 描述 的 是 数 
据 库 的 结构 ,而 不 是 数据 库 本 身 , 它 只 是 装配 数据 的 一 个 框架 。 

@ 数据 库 模式 以 某 一 种 数据 模型 为 基础 构造 。 定 义 模式 时 不 仅 要 定义 数据 的 迎 辑 结 
构 ( 如 数据 记录 由 哪些 数据 项 构成 ,数据 项 的 名 字 、 类 型 . 取 值 范围 等 ) ,而 且 要 定义 这 些 数 据 
之 间 的 联系 ,定义 与 数据 有 关 的 安全 性 完整 性 要 求 等 。 

@ 模式 用 模式 描述 语言 描述 和 定义 。 一 般 DBMS 都 提供 模式 描述 语言 (模式 DDL) 来 
严格 定义 模式 。 

例如 : 在 一 个 关系 数据 库 管理 系统 中 ,模式 主要 描述 存储 在 数据 库 中 的 所 有 关系 。 在 
学 生 选 课 数据 库 中 ,一 方面 用 关系 描述 学 生 和 课程 实体 , 另 一 方面 用 关系 描述 学 生 课程 之 间 
的 联系 一 一 学 生 选 课 。 下 面 的 学 生 选 课 数 据 库 模式 给 出 了 关系 名 称 、 属 性 名 称 以 及 主 码 : 

学 生 ( 学 号 、 姓 名、 性 别 、 出 生年 月 .所 在 院 系 、 入 学 时 间 、 家 庭 住址 ) 

课程 (课程 号 .课程 名 ,学 分 ) 

选课 (学 号 .课程 号 .成 绩 ) 

在 DBMS 中 ,用 于 定义 模式 的 数据 库 语 言 称 为 模式 数据 定义 语言 (Schema Data 
Definition Language, 模 式 DDL) 。 

2. 外 模式 

定义 : 外 模式 (External Schema) 也 称 子 模式 或 用 户 模式 ,是 数据 库 用 户 和 数据 库 系统 
的 接口 ,是 数据 用 户 的 数据 视图 (View) ,是 与 某 一 具体 应 用 相关 联 数据 的 逻辑 表示 。 外 模 
式 是 用 户 与 数据 库 的 接口 , 它 主 要 描述 用 户 视 图 的 各 记录 的 组 成 .相互 联系 、 数 据 项 的 特征 、 


数据 的 安全 性 和 完整 性 约束 条 件 等 。 

说 明 : 

外 模式 一 般 是 模式 的 子 集 。 一 个 数据 库 可 以 有 多 个 外 模式 ; 每 个 用 户 至 少 使 用 一 
个 外 模式 。 


@ 同一 个 外 模式 可 以 为 某 一 用 户 的 多 个 应 用 系统 所 使 用 , 即 同一 外 模式 可 为 多 个 应 用 
程序 所 使 用 ,但 一 个 应 用 程序 只 能 使 用 一 个 外 模式 。 这 是 因为 当 不 同 用 户 在 应 用 需求 ,保密 


绪论 


数据 亩 原理 及 应 用 裁 程 一 -SQL Server 2014 


级 别 等 方面 存在 差异 时 ,不 同 用 户外 模式 的 描述 就 会 不 同 。 

@ 外 模式 是 模式 的 子 集 。 模 式 是 对 全 体 用 户 数 据 及 其 关系 的 综合 、 归 纳 和 抽象 ,外 模 
式 是 根据 用 户 的 具体 需求 对 模式 的 抽取 ,因此 模式 的 设计 是 外 模式 设计 的 基础 。 

@ 外 模式 是 保证 数据 安全 性 的 一 个 有 力 措施 。 每 个 用 户 只 能 访问 和 操作 所 对 应 的 外 
模式 中 的 数据 ,而 数据 库 中 的 其 他 数据 均 不 可 见 。 

@ 在 DBMS 中 ,用 外 模式 数据 定义 语言 (External Schema Data Definition Language) 
来 定义 外 模式 , 即 外 模式 DDL 。 

在 RDBMS 中 ,外 模式 主要 通过 视图 来 实现 。 如 在 学 生 选 课 数据 库 中 ,定义 视图 “学 生 
选课 成 绩 ” 如 下 : 


学 生 选 课 成 绩 ( 学 号 ,姓名 ,课程 号 ,课程 名 ,成 绩 ) 


在 该 视图 中 ,学 号 和 姓名 来 自学 生 关系 ,课程 号 和 课程 名 来 自 课 程 关 系 , 成 绩 来 自选 课 
关系 。 视 图 在 结构 上 与 关系 相似 ,但 关系 数据 库 只 存储 视图 的 定义 ,不 存储 视图 的 数据 。 视 
图 的 数据 是 在 使 用 时 根据 关系 中 存储 的 数据 和 视图 的 定义 动态 计算 得 到 的 。 视 图 就 是 
RDBMS 提供 的 外 模式 。( 关 于 视图 的 相关 内 容 将 在 第 3 章 具体 介绍 ) 

3. 内 模式 

定义 : 内 模式 (Internal Schema) 也 称 存储 模式 或 物理 模式 。 它 是 数据 物理 结构 和 存储 
方法 的 描述 ,是 数据 在 数据 库 内 部 的 表示 方式 ,也 是 整个 数据 库 的 最 低层 结构 的 表示 。 一 个 
数据 库 只 有 一 个 内 模式 。 

在 内 模式 中 要 定义 数据 的 结构 和 存储 方式 主要 有 : 文件 类 型 ,数据 的 存储 方式 (顺序 存 
储 、 按 照 B+ 树 结构 存储 、 按 Hash 方式 存储 ) ,索引 文件 的 结构 ,数据 的 压缩 或 加 密 处 理 , 存 
储 设备 ,物理 块 的 大 小 等 。 

例如 学 生 记录 ,如果 按 顺 序 存储 ,如 图 1-27(a) 所 示 , 则 插入 的 一 条 新 记录 总 是 放 在 学 生 
记录 存储 的 最 后 ; 如 果 按 学 号 升序 存储 ,如 图 1-27(b) 所 示 , 则 插入 的 一 条 记录 就 要 找到 它 
应 在 的 位 置 再 插入 ; 如 果 按照 学 生年 龄 聚 簇 存 放 , 假 如 新 插入 的 S3 是 16 岁 , 则 应 插入 的 位 
置 如 图 1-27(c) 所 示 。 


sl sl 16 
新 插入 S3 一 一 | 
S5 S6 16 
S6 S10 16 
入 S3 一 | 
S7 和 S5 17 
S9 S7 17 
S S10 S9 18 
新 插入 S3 一 一 | 
(a) (b) (0°) 


图 1-27 记录 不 同 的 存储 方式 示意 图 


说 明 : 

Q@ 一 个 数据 库 只 有 一 个 内 模式 。 

@ 内 模式 对 用 户 透明 。 虽 然 内 模式 对 一 般 用 户 是 透明 的 ,但 它 的 设计 直接 影响 数据 库 
的 性 能 。 所 以 ,数据库 的 设计 者 和 维护 者 应 对 其 有 充分 的 了 解 , 这 样 才能 更 合理 .更 有 效 地 


维护 数据 库 。 

@ 一 个 数据 库 由 多 种 文件 组 成 。 如 数据 库 系统 文件 ,用户 数 据 文件 .索引 文件 等 。 
DBMS 用 于 定义 内 模式 的 数据 库 语 言 称 为 内 模式 数据 定义 语言 (Internal Schema Data 
Definition Language) , 即 内 模式 DDL。 

数据 库 的 内 模式 依赖 于 它 的 全 局 逻辑 结构 , 即 模式 ,但 独立 于 数据 库 的 用 户 视图 即 外 模 
式 。 内 模式 的 设计 目标 是 保证 物理 存储 设备 有 较 好 的 时 间 效 率 和 空间 效率 。 

如 图 1-28 是 学 生 选 课 关 系数 据 库 三 级 模式 的 一 个 实例 。 


用 户 1: 学 生 处 用 户 2 : 教务 处 
学 生成 绩 音 课程 平均 成 绩 音 
学 号 | 字符 | 10 | was | sf | 6 
姓名 | 字符 | 8 | 课程 名 | 字符 | 18 
外 模式 
课程 号 | 字符 | 6 | 大 | 整 型 | 3 
成 绩 | 整 型 | 3 


> _ 学生 选课 关 系 课程 关系 


1 1 
1 1 
1 1 
| 学 号 | 字符 10 学 号 | 字符 10 课程 号 | 字符 6 | 
1 
模式 》 | 姓名 | 字符 | 8 | | 课程 | 字符 | 6 | 课程 名 | 字符 | 18 | ， 
1 | | 宇和 | 20 || 三 | 旦 | 3 || 学分 | 娄 和 a| 1 | 1 

| 

1 1 

1 | 数据 文件 数据 文件 数据 文件 | ， 

内 模式 1 1 

1 | 家 引文 作 索引 文件 索引 文件 | 1! 


图 1-28 学 生 选 课 关 系数 据 库 三 级 模式 的 一 个 实例 


1.3.3 数据 库 的 二 级 映像 功能 与 数据 独立 性 


DBMS 为 了 实现 三 级 模式 结构 ,不仅 提供 了 定义 内 模式 、 模 式 、 外 模式 的 语言 ,而 且 还 
在 三 级 模式 之 间 提 供 了 二 级 映像 , 即 外 模式 /模式 映像 和 模式 /内 模式 映像 。 正 是 这 二 级 映 
像 保 证 了 数据 库 系统 中 的 数据 具有 较 高 的 数据 独立 性 。 

数据 独立 性 一 般 分 为 物理 独立 性 与 逮 辑 独立 性 两 级 。 

物理 独立 性 : 是 指数 据 库 物理 结构 的 改变 ( 即 内 模式 的 改变 ) 不 会 影响 迎 辑 结构 (模式 ) 
及 应 用 程序 (外 模式 )。 即 数据 的 存储 结构 改变 了 ,如 选用 了 另 一 种 类 型 的 存储 文件 、 删 除了 
原 有 的 索引 建立 了 新 的 索引 等 都 不 影响 数据 库 的 迎 辑 结构 ( 即 模式 ) 的 变化 ,因此 应 用 程序 
不 会 受到 影响 。 

四 辑 独 立 性 ; 是 指数 据 库 逻 辑 结 构 ( 即 模式 ) 的 改变 不 影响 应 用 程序 。 即 当 模 式 改变 
时 ,如 增加 新 的 实体 、 新 的 数据 类 型 .新 的 属性 、 更 改 属性 的 数据 、 改 变数 据 间 联系 类 型 等 ,不 
需要 相应 修改 应 用 程序 ,这 就 是 数据 的 人 逻辑 独立 性 。 


妾 论 
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为 了 保证 数据 独立 性 ,DBMS 在 三 级 模式 之 间 提 供 两 级 映像 ,下 面 分 别 介绍 二 级 映像 
的 具体 内 容 。 

1. 模式 /内 模式 映像 

模式 /内 模式 映像 是 说 明 模式 在 物理 设备 中 的 存储 结构 , 它 定义 了 概念 模式 和 内 模式 之 
间 的 对 应 关系 。 模 式 /内 模式 映像 的 定义 一 般 由 内 模式 的 定义 描述 指定 。 

因为 数据 库 只 有 一 个 模式 ,也 只 有 一 个 内 模式 ,所 以 模式 /内 模式 映像 是 唯一 的 。 它 定 
义 了 数据 全 局 逻辑 结构 与 存储 结构 之 间 的 映射 关系 。 当 数据 库 的 存储 结构 改变 时 ,如 采用 
了 更 先进 的 存储 结构 ,由 数据 库 管 理 员 对 模式 /内 模式 映像 做 出 相应 修改 ,可 以 使 模式 保持 
不 变 ,当然 应 用 程序 代码 也 不 需要 修改 ,从 而 保证 了 数据 的 物理 独立 性 。 

又 如 若 数据 库 管 理 系 统 升 级 了 ,管理 系统 一 般 会 将 以 前 的 模式 用 新 存储 方式 进行 存储 ， 
不 会 影响 用 户 应 用 程序 的 使 用 。 

数据 库 的 内 模式 依赖 于 它 的 全 局 多 辑 结构 ,但 独立 于 数据 库 的 用 户 视图 , 即 外 模式 ,也 
独立 于 具体 的 存储 设备 。 它 是 将 全 局 逻辑 结构 中 所 定义 的 数据 结构 及 其 联系 按照 一 定 的 物 
理 存储 策略 进行 组 织 以 达到 较 好 的 时 间 与 空间 效率 。 

2. 外 模式 /模式 映像 

外 模式 /模式 映像 是 指 由 模式 生成 外 模式 的 规则 , 它 定义 了 各 个 外 模式 和 概念 模式 之 间 
的 对 应 关系 。 这 些 映 像 定 义 通 常 包 含 在 各 个 外 模式 的 定义 描述 中 。 

模式 描述 数据 的 全 局 多 辑 结构 ,一 个 数据 库 只 有 一 个 模式 ; 外 模式 描述 数据 的 局 部 由 
辑 结构 ,一 个 数据 库 可 以 有 多 个 外 模式 。 因 此 外 模式 /模式 映像 不 唯一 ,由 一 个 模式 可 以 推 
导出 任意 多 个 外 模式 。 对 于 每 个 外 模式 ,数据 库 系统 都 定义 一 个 外 模式 /模式 映像 ,描述 该 
外 模式 与 模式 之 间 的 映射 关系 。 

当 模 式 改变 时 ,如 增加 新 的 数据 类 型 .新 的 属性 \ 改 变 属性 名 字 等 ,只 要 由 数据 库 管理 员 
对 各 个 外 模式 /模式 映像 做 出 相应 修改 ,就 可 以 使 外 模式 保持 不 变 。 而 应 用 程序 是 依赖 数据 
库 的 外 模式 开发 的 ,因此 应 用 程序 代码 不 必修 改 , 从 而 保证 了 数据 的 逻辑 独立 性 。 

例如 图 1-28 中 , 若 模式 “学 生 关系 "修改 为 由 "学 生 关系 1- 简 表 ” 和 "学 生 关 系 2- 档 案 表 ” 
两 部 分 组 成 ,此 时 若 产生 另 一 用 户外 模式 "学 生 总 表 ”, 只 需 由 这 两 个 新 关系 映射 产生 即 可 。 
若 用 户外 模式 "学 生成 绩 单 "修改 为 (学 号 ,姓名 ,课程 号 ,课程 名 ,学 分 ,成 绩 ) ,也 只 需要 改 为 
由 “学 生 关 系 “ 选 课 关 系 ” 和 “课程 关系 ”三 个 关系 映射 产生 即 可 。 不 必修 改 外 模式 ,因而 也 
不 会 影响 原 应 用 程序 , 故 在 一 定 程度 上 实现 了 数据 的 逻辑 独立 性 。 

说 明 : 

@ 模式 /内 模式 映像 是 唯一 的 。 因 为 数据 库 中 只 有 一 个 模式 及 一 个 内 模式 ,所 以 模式 / 
内 模式 映像 是 唯一 的 。 它 定义 了 数据 全 局 逻辑 结构 与 存储 结构 之 间 的 对 应 关系 。 该 映像 的 
定义 通常 包含 在 模式 描述 中 。 当 数据 库 的 存储 结构 改变 时 ,只 需 由 数据 库 管 理 员 对 模式 /内 
模式 映像 作 相应 改变 ,可 以 使 模式 保持 不 变 , 从 而 保证 了 数据 的 物理 独立 性 ,不 会 影响 用 户 
应 用 程序 的 使 用 。 
@ 外 模式 /模式 映像 不 唯一 。 数据库 的 外 模式 面向 具体 的 应 用 程序 , 它 定义 在 逻辑 模 
式 之 上 ,但 独立 于 存储 模式 和 存储 设备 。 当 应 用 需求 发 生 较 大 变化 ,相应 外 模式 不 能 满足 其 
视图 要 求 时 ,该 外 模式 就 得 做 相应 改动 ,所 以 设计 外 模式 时 应 充分 考虑 应 用 的 扩充 性 。 

特定 的 应 用 程序 是 在 外 模式 描述 的 数据 结构 上 编制 的 , 它 依赖 于 特定 的 外 模式 ,与 数据 


库 的 模式 和 存储 结构 独立 。 不 同 的 应 用 程序 有 时 可 以 共用 同一 个 外 模式 。 数 据 库 的 二 级 映 
像 保证 了 数据 库 外 模式 的 稳定 性 ,从 而 从 底层 保证 了 应 用 程序 的 稳定 性 ,除非 应 用 需求 本 身 
发 生变 化 ,否则 应 用 程序 一 般 不 需要 修改 。 

数据 与 程序 之 间 的 独立 性 ,使 得 数据 的 定义 和 描述 可 以 从 应 用 程序 中 分 离 出 去 。 另 外 ， 
由 于 数据 的 存 取 由 DBMS 管理 ,用 户 不 必 考 虑 存 取 路 径 等 细节 ,从 而 简化 了 应 用 程序 的 编 
制 ,大 大 减少 了 应 用 程序 的 维护 和 修改 。 

在 数据 库 的 三 级 模式 结构 中 ,数据库 模式 (全 局 逻辑 结构 ?设计 是 数据 库 模 式 结构 设计 
的 核心 与 关键 , 它 独 立 于 数据 库 的 其 他 层次 。 因 此 设计 数据 库 模式 结构 时 应 首先 确定 数据 
库 的 逻辑 模式 。 

综 上 所 述 , 正 是 这 三 级 模式 结构 和 它们 之 间 的 两 层 映像 ,保证 了 数据 库 系统 的 数据 能 够 
具有 较 高 的 迎 辑 独立 性 和 物理 独立 性 。 有 效 地 实现 数据 库 三 级 模式 之 间 的 转换 是 数据 库 管 
理 系 统 的 职能 。 


1.4 数据 库 系 统 的 组 成 


一 个 数据 库 系统 一 般 由 三 大 部 分 组 成 : 
计算 机 硬件 平台 ; 
软件 系统 : 包括 操作 系统 、 数 据 库 管理 系统 数据库、 语言 工具 与 开发 环境 、 数 据 库 
应 用 软件 等 ; 

。 人 员 。 

1. 数据 库 系统 的 硬件 平台 

由 于 数据 库 系统 建立 在 计算 机 硬件 基础 之 上 , 它 在 必需 的 硬件 资源 支持 下 才能 工作 , 因 
而 系统 的 计算 机 设备 配置 情况 是 影响 数据 库 运 行 的 重要 因素 。 

支持 数据 库 系统 的 计算 机 硬件 资源 包括 计算 机 (服务 器 及 客户 机 ) 数据 通信 设备 (计算 
机 网 络 和 多 用 户 数据 传输 设备 ) 及 其 他 外 围 设备 (特殊 的 数据 输入 输出 设备 ,比如 图 形 扫描 
仪 .大 屏幕 的 显示 器 及 激光 打印 机 ) 等 。 由 于 数据 库 系 统 数据 量 都 很 大 ,数据 结构 复杂 ,软件 
内 容 多 ,加 之 DBMS 丰富 的 功能 使 得 自身 的 规模 也 很 大 ,因而 要 求 其 硬件 设备 能 够 快速 处 
理 它 的 数据 。 这 就 需要 硬件 的 数据 存储 容量 大 、 数 据 处 理 速度 和 数据 输入 输出 速度 快 , 在 进 
行 数据 库 系 统 的 硬件 配置 时 ,应 注意 以 下 3 个 方面 的 问题 。 

(1) 计算 机 内 存 要 尽量 大 。 用 来 存放 操作 系统 .DBMS 的 核心 模块 数据 缓冲 区 和 应 用 
程序 。 

数据 库 系统 与 其 他 计算 机 系统 相 比 需要 更 多 的 内 存 支持 。 由 于 数据 库 系统 的 软件 构成 
复杂 , 它 包括 操作 系统 、 数 据 库 管理 系统 、 应 用 程序 及 数据 库 ,工作 时 它们 都 需要 一 定 的 内 存 
作为 程序 工作 区 或 数据 缓冲 区 。 所 以 ,计算 机 内 存 的 大 小 对 数据 库 系统 性 能 的 影响 是 非常 
明显 的 ,内 存 大 就 可 以 建立 较 多 、 较 大 的 程序 工作 区 或 数据 缓冲 区 ,以 管理 更 多 的 数据 文件 
和 控制 更 多 的 程序 过 程 , 进 行 比较 复杂 的 数据 管理 和 更 快 地 进行 数据 操作 。 每 种 数据 库 系 
统 对 计算 机 内 存 都 有 最 低 要 求 ,如 果 计 算 机 内 存 达 不 到 其 最 低 要 求 ,系统 将 不 能 正常 工作 。 

(2) 计算 机 外 存 也 要 尽量 大 。 即 要 有 足够 大 的 磁盘 或 磁盘 阵列 等 设备 存放 数据 库 , 有 
足够 的 磁带 或 光盘 作 数 据 备份 。 
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由 于 数据 库 中 的 数据 量 非常 大 并 且 软 件 种 类 繁多 , 它 必然 需要 较 大 的 外 存 空 间 来 存储 
其 数据 文件 和 程序 文件 。 计 算 机 外 存 主要 有 软磁盘 、 磁 带 和 硬盘 ,其 中 硬盘 是 最 主要 的 外 存 
设备 。 数 据 库 系统 要 求 硬盘 的 数据 容量 尽量 大 些 。 硬 盘 大 可 以 为 数据 文件 和 数据 库 软 件 提 
供 足够 的 空间 ,满足 数据 和 程序 的 存储 需要 ,并 可 以 为 系统 的 临时 文件 提供 存储 空间 ,保证 
系统 能 正常 运行 数据 ,搜索 时 间 较 短 , 从 而 加 快 数据 存 取 速度 。 

(3) 要 求 系统 有 较 高 的 通道 能 力 ,以 提高 数据 传送 率 。 

由 于 数据 库 的 数据 量 大 而 操作 复杂 度 不 大 ,数据 库 工作 时 需要 经 常 进行 内 、 外 存 的 交换 
操作 ,这 就 要 求 计算 机 不 仅 要 有 和 较 强 的 通道 能 力 ,而且 数据 存 取 和 数据 交换 的 速度 要 快 。 虽 
然 计 算 机 的 运行 速度 由 CPU 计算 速度 和 数据 I/O 的 传输 速度 两 者 决定 ,但 是 对 于 数据 库 
系统 来 说 ,加 快 数据 I/O 的 传输 速度 是 提高 运行 速度 的 关键 ,提高 数据 传输 速度 是 提高 数 
据 库 系统 效率 的 重要 指标 。 对 于 网 络 上 运行 的 数据 库 系 统 , 还 需要 考虑 网 络 上 的 传输 效率 。 

2. 数据 库 系统 的 软件 组 成 

数据 库 系统 的 软件 主要 包括 以 下 几 部 分 。 

(1) 数据 库 管 理 系统 和 主语 言 编译 系统 。 数 据 库 管理 系统 (DBMS) 是 为 数据 库 定义 、 
建立 、 维 护 使用、 控制 和 维护 配置 而 提供 数据 管理 的 系统 软件 。 主 语言 编译 系统 是 为 应 用 
程序 提供 的 诸如 程序 控制 .数据 输入 输出 ,功能 函数 .图 形 处 理 、 计 算 方 法 等 数据 处 理 功能 的 
系统 软件 。 由 于 数据 库 的 应 用 很 广泛 ,涉及 的 领域 很 多 ,其 全 部 功能 DBMS 不 可 能 全 部 提 
供 。 因 而 ,应 用 系统 的 设计 与 实现 ,需要 数据 库 和 主语 言 配合 ,这 样 便于 应 用 系统 的 开发 。 

这 样 做 有 三 个 好 处 : 一 是 它 使 得 DBMS 只 需要 考虑 如 何 把 有 关 数 据 管理 和 控制 的 功 
能 做 好 而 不 需 考虑 其 他 功能 ,可 使 其 操作 便利 、 功 能 更 好 。 二 是 可 使 应 用 系统 根据 使 用 要 求 
自由 地 选择 主语 言 (常用 的 主语 言 有 C# 、. NET,COBOL、PL/1 等 ) ,给 用 户 带 来 了 极 大 的 
灵活 性 。 三 是 由 于 DBMS 可 以 与 多 种 语言 配合 使 用 ,这 等 于 使 这 些 主 语言 都 具有 了 数据 库 
管理 功能 ,从 而 能 够 发 挥 更 大 的 作用 。 

还 有 一 些 高 级 DBMS 自 带 集成 开发 环境 。 如 Microsoft 公司 的 VFP、Oracle 公司 的 
Oracle 等 。 

(2) 支持 DBMS 运行 的 操作 系统 。 操 作 系 统 是 所 有 计算 机 软件 的 基础 , 它 是 整个 数据 
库 系 统 的 重要 软件 平台 ,提供 基础 功能 与 支撑 环境 。 在 数据 库 系 统 中 起 着 支持 DBMS 及 主 
语言 系统 工作 的 作用 。 目 前 常用 的 操作 系统 有 Windows、UNIX、Linux 与 OS2 等 。 

(3) 以 DBMS 为 核心 的 应 用 开发 工具 。 数 据 库 应 用 开发 工具 是 DBMS 系统 为 应 用 开 
发 人 员 和 最 终 用 户 提供 的 高 效率 、 多 功能 的 应 用 生成 器 .第 4 代 计算 机 语言 等 各 种 软件 工 
具 , 如 报表 生成 器 .表单 生成 器 .查询 和 视图 设计 器 等 ,它们 为 数据 库 系统 的 开发 和 使 用 提供 
了 和 良好 的 环境 和 帮助 。 

(4) 为 特定 应 用 环境 开发 的 数据 库 应 用 系统 。 在 数据 库 系 统 中 ,应 用 软件 和 界面 是 利 
用 数据 库 管 理 系统 及 其 相关 的 开发 工具 为 特定 应 用 而 开发 的 软件 。 

数据 库 应 用 系统 包括 为 特定 应 用 环境 建立 的 数据 库 、 开 发 的 各 类 应 用 程序 及 编写 的 文 
档 资料 ,它们 是 一 个 有 机 整体 。 数 据 库 应 用 系统 涉及 各 个 方面 ,例如 信息 管理 系统 .人 工 智 
能 .计算 机 控制 和 计算 机 图 形 处 理 等 。 通 过 运行 数据 库 应 用 系统 ,可 以 实现 对 数据 库 中 数据 
的 维护 查询、 管理 和 处 理 操作 。 

(5) 数据 库 。 它 是 反映 企业 或 组 织 当前 状态 的 数据 集合 。 这 里 当前 状态 是 指 企业 或 组 


织 的 经 营 情况 ,如 当前 财务 情况 人员 构成 情况 。 为 应 用 方便 ,用 数据 库 中 的 数据 含义 来 标 
识 数据 库 。 如 人 事 数据 库 、 学 生 学 籍 成 绩 数 据 库 等 。 

3. 人 员 

数据 库 系统 的 建设 、 使 用 与 维护 可 以 看 作 一 个 系统 工程 ,需要 各 种 人 员 配 合 来 完成 。 

数据 库 系 统 中 的 人 员 包 括 以 下 几 部 分 。 

(1) 数据 库 管 理 员 (DataBase Administrator, DBA) 

DBA 在 数据 库 系 统 中 是 一 个 非常 重要 角色 。 为 了 保证 DBMS 服务 及 数据 库 的 可 用 
性 \ 可 靠 性 、 安 全 性 \ 稳 定性 和 高 性 能 ,需要 有 专门 的 人 员 对 DBMS 及 其 管理 的 数据 库 进行 
监管 和 维护 。DBA 不 一 定 只 是 一 个 人 , 它 往往 可 能 是 一 个 工作 小 组 。 其 主要 职责 有 设计 、 
建立 ,管理 和 维护 数据 库 , 协 调 各 用 户 对 数据 库 的 要 求 等 。 因 此 ,DBA 不 仅 要 熟悉 、 掌 握 
DBMS 和 数据 库 的 理论 知识 ,更 要 熟悉 数据 库 系统 当前 使 用 的 具体 DBMS 产品 (如 Oracle、 
SQL Server、DB2) 的 使 用 方法 ,充分 了 解 各 种 用 户 的 需求 ,了 解 各 应 用 部 门 的 业务 工作 , 具 
有 系统 分 析 员 和 运筹 学 专家 的 知识 。 所 以 ,DBA 通常 是 信息 技术 方面 的 专业 人 员 ,负责 全 
局 控制 。 

(2) 系统 分 析 员 和 数据 库 设 计 人 员 

系统 分 析 员 是 数据 库 系统 设计 中 的 高 级 人 员 。 主 要 负责 数据 库 系统 建设 的 前 期 工作 ， 
包括 应 用 系统 的 需求 分 析 、 规 范 说 明和 数据 库 系统 的 总 体 设计 等 。 

数据 库 设计 人 员 要 在 参与 用 户 需 求 调查 、 应 用 系统 的 需求 分 析 后 ,根据 需求 分 析 说 明 
书 , 主 要 负责 数据 库 的 设计 ,设计 数据 库 的 概念 模型 和 逻辑 模型 。 包 括 各 级 模式 的 设计 、 确 
定数 据 库 中 的 数据 等 。 

(3) 应 用 程序 开发 人 员 

应 用 程序 开发 人 员 负 责 应 用 程序 的 详细 设计 和 代码 编写 ,使 用 某 些 高 级 语言 或 利用 多 
种 数据 库 开 发 工具 实现 需求 分 析 说 明 书 中 要 求 的 各 项 功能 ,用 以 完成 对 数据 库 的 操作 ,并 负 
责 完成 应 用 程序 各 模块 的 单元 测试 和 多 模块 的 集成 测试 ,编写 各 种 开发 文档 和 用 户 使 用 
手册 。 

(4) 用 户 

这 里 用 户 是 指 最 终 用 户 (End User)。 是 整个 数据 库 系统 面向 的 服务 人 群 。 最 终 用 户 
通过 应 用 系统 的 用 户 接口 使 用 数据 库 。 如 公司 .银行 的 职员 .操作 员 等 ,他 们 通过 用 户 界面 ， 
如 浏览 器 网 页 .图形 表格 、 功 能 菜单 等 使 用 数据 库 。 


1.5 小 结 


本 章 概述 了 数据 \ 数 据 库 ,数据库 管 理 系统 和 数据 库 系统 的 基本 概念 ,并 通过 对 数据 管 
理 情 况 的 简单 介绍 ,阐述 了 数据 库 技术 产生 和 发 展 的 背景 ,并 进一步 说 明了 数据 库 系统 的 
特点 。 

数据 模型 是 数据 库 系统 的 核心 和 基础 。 本 章 介绍 了 数据 描述 的 三 个 世界 .概念 模型 和 
三 种 主要 的 数据 库 模型 。 

概念 模型 也 称 信息 模型 ,用 于 信息 世界 的 建 模 ,E-R 模型 是 这 类 模型 的 典型 代表 ,E-R 
方法 简单 .清晰 ,应 用 十 分 广泛 。 
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数据 模型 的 发 展 经 历 了 格式 化 数据 模型 (包括 层次 模型 和 网 状 模型 )、 关 系 模型 .面向 对 
象 模 型 .对象 关系 模型 等 非 传统 数据 模型 阶段 。 本 章 较为 详细 地 讲解 了 层次 模型 和 网 状 模 
型 ,对 关系 模型 只 是 简单 介绍 ,因为 后 续 章节 会 进行 详细 讲解 。 

接 下 来 介绍 数据 库 系 统 三 级 模式 和 两 层 映像 的 系统 结构 ,这 些 保 证 了 数据 库 系统 中 能 
够 具有 较 高 的 数据 的 逻辑 独立 性 和 物理 独立 性 。 

最 后 介绍 了 数据 库 系统 的 组 成 ,使 读者 了 解 到 数据 库 系统 不 仅 是 一 个 计算 机 系统 ,而 是 
一 个 人 -机 系统 ,人 的 作用 特别 是 DBA 的 作用 尤为 重要 。 

学 习 这 一 章 应 把 注意 力 放 在 掌握 基本 概念 和 基本 知识 方面 ,为 进一步 学 习 后 续 章 节 打 
好 基础 。 本 章 新 概念 较 多 ,如 果 是 刚 开 始 学 习 数 据 库 ,可 在 学 习 后 续 章节 后 再 返回 进一步 理 
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一 、 名 词 解释 与 理解 
1. 数据 、 数 据 库 (DB) .数据 库 系统 (DBS) ,数据 库 管理 系统 (DBMS) 模式、 外 模式 、 内 
模式 .数据 的 迎 辑 独立 性 .数据 的 物理 独立 性 、E-R 模型 .层次 模型 网 状 模型 .关系 模型 、 面 
向 对 象 模型 。 
2. 实体 、 实 体型 .实体 集 、 属 性 、 码 、 实 体 联系 图 (E-R 图 ) 。 
二 、 简 答题 
. 试 述 数据 模型 的 概念 .数据 模型 的 作用 和 数据 模型 的 3 个 要 素 。 
. 人 工 管理 ,文件 系统 和 数据 库 系 统 阶 段 的 数据 管理 各 有 哪些 特点 ? 
. 什么 是 数据 宛 余 ?数据库 系 统 与 文件 系统 相 比 怎样 减少 元 余 ? 
试 述 概念 模型 的 作用 。 
. 层次 模型 .网 状 模型 和 关系 模型 是 根据 什么 来 划分 的 ? 这 三 种 基本 模型 各 有 哪些 优 
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. 数据 库 系统 的 基本 特点 是 什么 ? 
. 数据 库 的 三 级 模式 结构 描述 了 什么 ? 为 什么 在 三 级 模式 结构 之 间 提 供 两 级 映像 ? 
. 试 举 出 三 个 实例 ,要 求 两 个 实体 集 之 间 具 有 一 对 一 、 一 对 多 、 多 对 多 的 不 同 的 联系 。 
. 试 述 层 次 模型 的 概念 , 举 出 一 个 层次 模型 的 实例 。 

10. 试 述 网 状 模型 的 概念 , 举 出 一 个 网 状 模型 的 实例 。 

11. 为 什么 我 们 目前 所 使 用 的 数据 库 管理 系统 大 都 是 关系 数据 库 管理 系统 ? 

12. 试 叙述 概念 模型 与 好 辑 模型 的 主要 区 别 ? 

三 、 操 作 题 

1. 某 公 司 承担 多 个 工程 项 目 , 公 司 的 一 名 员工 可 以 参与 多 个 项 目 ,一 个 项 目 团队 由 多 
名 员工 组 成 ,员工 具有 编号 、 姓 名 、 性 别 、 职 务 等 属性 ,项 目 具 有 编号 .名 称 、 描 述 、 工 期 等 属 
性 。 该 公司 要 根据 上 述 情况 设计 “项 目 -员工 ”数据 库 。 画 出 表示 该 数据 库 ER 模型 的 ER 图 。 

2. 一 个 百货 公司 有 若干 连锁 店 ,每 家 连锁 店 经 营 若干 商品 ,同一 种 商品 可 以 在 任何 一 
家 连锁 店 中 销售 ,每 家 连锁 店 有 若干 职工 ,但 每 个 职工 只 能 服务 于 一 家 商店 。 现 该 百货 公司 
准备 建 一 个 计算 机 管理 系统 ,请 你 帮助 设计 一 个 数据 库 模 式 , 基 于 该 数据 库 模 式 ,百货 公司 


经 理 可 以 掌握 职工 信息 、 连 锁 店 商 品 信息 和 销售 信息 。 已 知 基本 信息 有 : 

* 连锁 店 : 连锁 店名 、 地 址 、 经 理 职工 号 。 

* 职工 : 职工 号 、 职 工 名 ,年 龄 .性别 。 

* 商品 : 商品 号 、 商 品名 、 价 格 、 生 产 厂家 。 
画 出 表示 该 数据 库 的 E-R 图 。 

3. 学 校 中 有 若干 系 ,每 个 系 有 若干 班级 和 教研 室 ,每 个 教研 室 有 若干 教员 ,其 中 有 的 教 
授 和 副教授 每 人 各 带 若 干 研究 生 , 每 个 班 若干 学 生 ,每 个 学 生 选 修 若干 课程 ,每 门 课 可 由 若 
干 学 生 选 修 。 自 行 设计 各 实体 的 若干 属性 ,用 E-R 图 画 出 表示 此 学 校 的 概念 模型 。 

4. 有 一 个 数据 库 记 录 球 队 、 队 员 和 球迷 的 信息 ,包括 : 

(1) 对 于 每 个 球 队 ,有 球 队 的 名 字 、 队 员 、 队 长 (队员 之 一 ) 以 及 队 服 的 颜色 。 

(2) 对 于 每 个 队员 ,有 其 姓名 和 所 属 球 队 。 

(3) 对 于 每 个 球迷 ,有 其 姓名 、 最 喜爱 的 球 队 、 最 喜爱 的 队员 以 及 最 喜爱 的 颜色 。 用 ER 
图 画 出 该 数据 库 的 概念 模型 。 
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【本 章 主要 内 容 】 

1. 详细 阐述 了 关系 数据 库 的 基础 知识 、 基 本 概念 。 包 括 关系 的 数据 结构 ,关系 的 基本 
操作 及 关系 模式 的 定义 。 

2. 简要 介绍 完整 性 约束 的 具体 内 容 。 

3. 重点 介绍 关系 代数 的 理论 及 相关 知识 。 

4. 简单 讨论 了 关系 演算 语言 的 相关 理论 。 

我 们 知道 ,关系 数据 库 建立 在 关系 模型 的 基础 上 ,首次 系统 化 提出 关系 模型 理论 的 是 美 
国 IBM 公司 的 研究 员 E. F. Codd。 他 于 1970 年 在 美国 计算 机 学 会 会 刊 Communications of 
the ACM 上 发 表 了 题 为 A Relational Model of Data for Shared Data Banks 的 论文 ,该 论 
文 开创 了 数据 库 领域 的 新 纪元 。 此 后 ,Codd 博士 连续 发 表 了 多 篇 论文 , 葛 定 了 关系 数据 库 
的 理论 基础 。 

从 关系 数据 库 诞生 至 今 已 接近 半 个 世纪 的 时 间 , 关 系数 据 库 早 已 由 实验 室 走向 社会 
生产 ,深入 到 人 们 生活 的 方方面面 ,成 为 最 重要 、 应 用 最 广泛 的 数据 库 系统 ,大 大 促进 了 
数据 库 应 用 领域 的 扩大 ,其 优势 也 得 到 了 各 行 各 业 的 肯定 。 随 着 其 性 能 不 断 提高 ,最终 
在 数据 库 产 品 市 场 上 占据 了 统治 地 位 。 关 系数 据 库 之 所 以 发 展 迅速 并 得 到 数据 库 业 界 
的 充分 肯定 ,是 由 于 它 是 建立 在 关系 模型 基础 上 的 数据 库 。 关 系 模型 具有 严格 的 数学 形 
式 化 定义 ,涉及 集合 论 和 数理 逻辑 的 相关 知识 ,并 形成 了 一 整套 完备 的 数据 存储 数据 访 
问 和 数据 控制 的 解决 方案 ,理解 关系 数据 模型 的 原理 .技术 和 应 用 十 分 重要 ,这 些 都 是 本 
书 的 关键 。 

关系 数据 模型 是 关系 数据 库 系统 的 基础 ,本 章 分 6 节 介绍 相关 内 容 。2. 1 节 主 要 介绍 
关系 模型 的 基本 概念 , 即 关 系 模型 的 数据 结构 并 详细 介绍 关系 模型 的 理论 基础 ; 2. 2 节 介 
绍 关系 操作 ; 2. 3 节 讨 论 关系 的 完整 性 ; 2. 4 节 讨 论 关系 代数 ,这 是 关系 数据 库 系 统 中 实现 
关系 操作 的 一 种 语言 ; 2. 5 简要 介绍 关系 演算 ; 最 后 介绍 常用 的 关系 数据 库 产品 。 


2.1 关系 的 数据 结构 及 相关 定义 


关系 数据 库 系统 是 支持 关系 模型 的 数据 库 系统 。 第 1 章 我 们 已 对 关系 模型 有 了 初步 认 
识 , 了 解 了 关系 模型 的 一 些 基 本 术语 。 这 一 章 将 深入 地 讲解 关系 模型 的 相关 理论 。 


2.1.1 关系 的 数据 结构 


关系 数据 模型 是 数据 库 的 最 常用 模型 , 它 用 “关系 ”来 描述 数据 。 即 关系 是 一 张 扁平 的 
二 维 表 。 因 此 可 以 认为 ,关系 数据 模型 是 以 二 维 表 为 基础 的 数据 组 织 方法 。 

关系 模型 的 数据 结构 虽然 简单 却 能 够 表达 丰富 的 语义 ,能 够 描述 现实 世界 的 实体 以 及 
实体 之 间 的 各 种 联系 。 也 就 是 说 ,在 关系 模型 中 ,现实 世界 的 实体 以 及 实体 之 间 各 种 联系 均 
用 单一 的 结构 类 型 即 关系 来 表示 。 

当 人 们 把 关系 的 概念 引入 到 数据 库 系统 作为 数据 模型 的 数据 结构 时 ,这 一 概念 既 有 所 
限定 也 有 所 扩充 。 下 面 先 给 出 关系 的 数学 定义 ,然后 深入 讨论 它 作 为 关系 数据 模型 的 数据 
结构 时 的 限定 和 扩充 。 

1. 关系 的 数学 定义 

1) 域 

定义 2.1 域 (Domain) 是 一 组 具有 相同 数据 类 型 的 值 的 集合 。 

例如 ,整数 实数 、 自 然 数 (0,1)、{ 男 , 女 }、{ 信 息 学 院 , 基 础 学 院 , 外 语 学 院 )、 信 息 学 院 
所 有 学 生 的 姓名 、 小 于 100 的 正 整 数 等 都 可 以 是 域 。 域 用 来 表明 所 定义 属性 (变量 ) 的 取 值 

2) 笛 卡 儿 积 

定义 2.2 给 定 一 组 域 Di ,D;,…,D, ,这 些 域 中 可 以 有 相同 的 部 分 , 则 Di ,D;,…,D, 的 
笛 卡 儿 积 (Cartesian Product) 为 : 

DXD,X:…XD,={(di, ds,*…,d,)|dED;, i=1,2,.…,n} 
其 中 每 一 个 元 素 (di ， ds,…,d,) 叫 作 一 个 元 组 (n-tuple) 或 简称 元 组 (Tuple)。nn 元 组 中 的 
每 一 个 值 d; 叫 作 一 个 分 量 (Component) 。 
这 些 域 中 可 以 存在 相同 的 域 ,例如 D, 和 D, 可 以 是 相同 的 域 。 
若 D;(i 二 1,2,…,n) 为 有 限 集 , 其 基数 (Cardinal number) 为 m;(i 二 1,2,…,n), 则 DX 


D,x…XD, 的 基数 为 : M = ][m。 


笛 卡 儿 积 可 以 表示 成 一 个 二 维 表 。 表 中 的 每 行 对 应 一 个 元 组 , 表 中 的 每 列 对 应 一 个 域 。 
例如 给 出 3 个 域 : 


D, = 学 号 = {1703070101,1703070211} 
D, = 姓名 = { 李 艺 , 王 一 } 
D = 性 别 = { 男 , 女 } 


则 Di ,D: ,D; 的 笛 卡 儿 积 为 : 


D, xD xD ={ 
(1703070101, 李 艺 , 男 ), (1703070101, 李 艺 , 女 ) 
(1703070101, 王 一 , 男 ), (1703070101, 王 一 , 女 )， 
(1703070211, 李 艺 , 男 ), (1703070211, 李 艺 , 女 ) 
(1703070211, 王 一 , 男 ), (1703070211, 王 一 , 女 ) 


其 中 ,(1703070101, 李 艺 , 男 ),(1703070211, 王 一 , 男 ) 等 是 元 组 ;“1703070101”“ 李 艺 ”“ 男 ” 
等 是 分 量 。 该 笛 卡 儿 积 的 基数 为 2X2X2 王 8, 即 D, XD XD; 一 共有 2X2X2=8 个 元 组 ， 
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这 8 个 元 组 可 以 列 成 一 张 二 维 表 , 如 表 2-1 所 示 。 
表 2-1 Di 、D;、D; 的 笛 卡 儿 积 


学 号 姓名 性 别 
1703070101 地 艺 男 
1703070101 李 艺 女 
1703070101 EE 男 
1703070101 王 一 女 
1703070211 李 艺 男 
1703070211 李 艺 女 
1703070211 王 一 男 
1703070211 王 一 女 


3) 关系 (Relation) 
定义 2.3 DiXD:X…XD, 的 子 集 称 作 在 域 D, ,D,,…,D, 上 的 关系 ,表示 为 : 
R(D ,D: ,…，,D,) 

这 里 R 表示 关系 的 名 字 ," 是 关系 的 目 或 度 (Degree) 。 

从 表 2-1 可 以 看 出 ,Di ,Ds,…， Di 的 笛 卡 儿 积 是 没有 实际 语义 的 ,只 有 它 的 真子 集 才 
有 实际 含义 。 因 此 实际 上 关系 是 笛 卡 儿 积 的 有 限 子 集 。 所 以 从 结构 上 来 看 ,关系 就 是 一 张 
“二 维 表 ”, 二 维 表 由 垂直 方向 的 列 和 水 平方 向 的 行 交 叉 而 成 , 行 与 列 的 交叉 点 是 存放 数据 的 
单元 格 ,如 图 2-1 所 示 。 表 的 每 行 对 应 一 个 元 组 , 表 的 每 列 对 应 一 个 域 。 由 于 域 可 以 相同 ， 
为 了 区 分 不 同 的 域 ,必须 给 每 个 列 起 一 个 名 字 , 称 为 属性 (Attribute)。7 目 关 系 必 须 有 7 个 


vy 
二 维 表 
2-1 二 维 表 的 结构 


一 个 二 维 表 的 行 数 可 以 是 任意 多 ,而 列 数 是 有 限 的 ,要 访问 某 单元 格 必须 指明 相应 的 行 
和 列 。 二 维 表 可 以 作为 关系 的 一 种 表现 方式 ,但 它 并 不 严格 地 等 同 于 关系 ,二 维 表 中 允许 有 
重复 的 行 , 而 关系 中 不 允许 ; 二 维 表 在 显示 时 给 出 了 行 的 一 种 特定 顺序 ,而 关系 中 的 元 组 是 
无 序 的 。 实 际 上 ,内 存 中 创建 的 二 维 数组 就 是 一 张 二 维 表 , 关 系数 据 库 的 查询 结果 在 内 存 中 
也 是 一 张 二 维 表 ,通常 将 其 称 为 记录 集 (RecordSet) 。 

关系 中 的 每 个 元 素 是 关系 中 的 元 组 ,通常 用 t 表示 。 当 n= 二 1 时 , 称 该 关系 为 单元 关系 
(Unary Relation) ,或 一 元 关系 。 当 nn 二 2 时 , 称 该 关系 为 二 元 关系 (Binary Relation) 。 

在 关系 数据 模型 中 ,实体 和 联系 统一 用 “关系 ”这 种 结构 表示 。 


按照 定义 2.2, 关 系 可 以 是 一 个 无 限 集合 。 由 于 笛 卡 儿 积 不 满足 交换 律 , 因 此 按照 数学 
定义 ,(di， d,…,d) 天 (dd ,…,d)。 当 关系 作为 关系 数据 模型 的 数据 结构 时 ,需要 给 
予 如 下 的 限定 和 扩充 。 

(1) 限定 关系 数据 模型 中 的 关系 必须 是 有 限 集 合 。 因 为 无 限 关系 在 数据 库 系统 中 是 无 

(2) 通过 为 关系 的 每 个 列 附 加 一 个 属性 名 的 方法 取消 关系 属性 的 有 序 性 , 即 (d， 
dz sesdiod;s"" ,ds)= (di, dddd)GJ 一 1,2, 7)。 

从 表 2-1 我 们 可 以 看 出 ,由 于 一 个 学 生 只 能 有 一 个 学 号 ,姓名 和 性 别 , 笛 卡 儿 积 中 包括 
许多 无 意义 的 元 组 。 因 此 可 以 从 Di xD,Xx…XD, 中 取出 一 个 子 集 构造 一 个 有 意义 的 学 生 
关系 。 该 关系 的 元 组 是 实际 的 姓名 与 性 别 值 。 表 2-2 所 示 为 我 们 认为 有 意义 的 元 组 。 


表 2-2 学 生 关系 
学 号 姓名 性 别 
1703070101 李 艺 女 
1703070211 王 一 男 


了 解 了 关系 的 基本 概念 ,下 面 介绍 与 关系 相关 的 几 个 名 词 。 

4) 元 组 

在 介绍 稍 卡 儿 积 的 概念 时 我 们 了 解 到 ,关系 表 中 的 每 一 横行 称 作 一 个 元 组 CTuple) ,组 
成 元 组 的 元 素 为 分 量 。 数 据 库 中 的 一 个 实体 或 实体 之 间 的 一 个 联系 均 可 以 用 一 个 关系 表 
示 。 例 如 表 2-2 中 有 2 个 元 组 ,它们 分 别 对 应 2 个 学 生 。*“*1703070101, 李 艺 , 女 , ”是 一 个 元 
组 , 它 由 三 个 分 量 ( 学 号 ,姓名 ,性 别 ) 构 成 。 

5) 属性 

表 的 每 列 对 应 一 个 域 , 由 于 域 可 以 相同 ,为 了 加 以 区 分 ,必须 对 每 列 起 一 个 名 字 , 称 为 属 
性 (Attribute)。n 目 关系 必 有 nn 个 属性 。 每 个 属性 所 对 应 的 值 变 化 的 范围 叫 属性 的 值 域 
(简称 域 ) , 它 是 一 个 值 的 集合 ,关系 中 所 有 属性 的 实际 值 均 来 自 于 它 所 对 应 的 域 。 属 性 具有 
型 和 值 两 层 含义 ,属性 的 型 指 属性 名 和 属性 取 值 域 ,属性 的 值 指 属性 具体 的 取 值 。 由 于 关系 
中 的 属性 名 有 具有 标识 列 的 作用 ,因而 同一 关系 中 的 属性 名 ( 即 列 名 ) 不 能 相同 。 关 系 中 一 般 
含有 多 个 属性 ,用 来 表示 实体 的 特征 。 例 如 表 2-2 中 有 3 个 属性 ,它们 分 别 为 (学 号 ,姓名 ， 
性 别 ) 。 

6) 候选 码 和 主 码 

若 关系 中 的 某 个 属性 组 (或 单个 属性 ) 的 值 能 唯一 地 标识 一 个 元 组 ,而 其 子 集 不 能 , 则 称 
该 属性 组 为 候选 码 (Candidate Key) 。 为 数据 管理 方便 , 当 一 个 关系 有 多 个 候选 码 时 ,应 选 
定 其 中 的 一 个 候选 码 为 主 码 (Primary Key) 。 当 然 , 如 果 关 系 中 只 有 一 个 候选 码 ,这 个 唯一 
的 候选 码 就 是 主 码 。 例 如 ,假设 表 2-2 中 学 生 的 “学 号 ?是 该 学 生 关系 的 候选 码 ; 如 果 没 有 
重 名 的 学 生 , 则 学 生 的 “姓名 ?也 是 该 学 生 关系 的 候选 码 。 这 时 学 生 关系 的 候选 码 为 “学 号 ” 
和 “姓名 ”两 个 ,应 当选 择 “ 学 号 ”属性 作为 主 码 。 

7) 全 码 

最 简单 的 情况 是 一 个 关系 的 候选 码 中 只 包含 一 个 属性 , 则 称 它 为 单 属性 码 ; 若 候 选 码 
是 由 多 个 属性 构成 的 , 则 称 它 为 多 属性 码 。 最 极端 的 情况 是 关系 模式 的 所 有 属性 是 这 个 关 | 章 
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系 模式 候选 码 , 则 这 种 候选 码 为 全 码 (All-key)。 全 码 是 候选 码 的 特例 , 它 说 明 该 关系 中 不 
存在 属性 之 间 相 互 决定 的 情况 。 也 就 是 说 ,每 个 关系 必定 有 码 ( 指 主 码 ), 当 关系 中 没有 属性 
之 间 相互 决定 的 情况 时 , 它 的 码 就 是 全 码 。 例 如 , 设 有 以 下 关系 : 

学 生 ( 学 号 ,姓名 ,性 别 ,年 龄 ) 

借 书 (学 号 ,书号 ,日 期) 

学 生 选 课 ( 学 号 ,课程 号 ) 

其 中 ,学 生 关 系 的 码 为 “学 号 ”, 它 为 单 属性 码 ; 借 书 关系 中 “学 号 ”和 “书号 ” 合 在 一 起 是 
码 , 它 是 多 属性 码 ; 学 生 选 课表 中 的 学 号 和 课程 相互 独立 ,属性 间 不 存在 依赖 关系 , 它 的 码 
为 全 码 。 

8) 主 属性 和 非 主 属性 

候选 码 的 诸 属 性 称 为 主 属性 (Prime Attribute) 。 不 包含 在 任何 候选 码 中 的 属性 称 为 非 
主 属性 (Non-Prime Attribute) 或 非 码 属性 (Non-Key Attribute) 。 

由 上 可 知 , 关 系 是 元 组 的 集合 。 关 系 基 本 的 数据 结构 是 二 维 表 。 每 一 张 表 称 为 一 个 具 
体 关系 或 简称 为 关系 。 

二 维 表 的 行 称 为 关系 的 元 组 ,在 实际 使 用 中 ,关系 是 属性 值 域 的 笛 卡 儿 积 中 有 意义 的 元 
组 的 集合 。 可 从 表 2-1 的 笛 卡 儿 积 中 取出 一 个 有 意义 的 子 集 来 构造 一 个 关系 ,如 表 2-2 所 
示 , 该 关系 的 元 组 是 实际 的 “学 号 ,姓名 ,性 别 ” 的 具体 值 。 

二 维 表 中 的 每 一 列 称 为 关系 的 属性 (有 型 和 值 之 分 ) , 列 中 的 元 素 为 该 属性 的 值 , 称 作 分 
量 。 每 个 属性 所 对 应 的 值 变化 的 范围 叫 作 属性 的 值 域 (简称 域 ) , 它 是 一 个 值 的 集合 ,关系 中 
所 有 属性 的 实际 值 均 来 自 于 它 所 对 应 的 域 。 设 一 个 管理 数据 库 中 有 学 生 关 系 , 其 关系 、 元 
组 .属性 和 域 及 其 联系 如 图 2-2 所 示 。 


学 号 姓名 年 龄 性 别 籍贯 ”一 关系 的 型 


1703070101 。 李 艺 18 女 湖南 
1703070211 ” 王 一 19 男 河北 
1703070120 。 张 欣 18 男 山西 ”一 元 组 
1703070125 吴 波 19 男 四 川 
1703070302 。 何 重 18 女 湖南 

属性 


2-2 关系 ,元 组 .属性 和 域 


2. 数据 库 中 关系 的 类 型 

关系 数据 库 中 的 关系 可 以 分 为 3 种 类 型 : 基本 关系 (通常 称 为 基本 表 或 基 表 ) 、 视 图 表 
和 查询 表 。 这 3 种 类 型 的 关系 以 不 同 的 身份 保存 在 数据 库 中 ,其 作用 和 处 理 方法 也 各 不 
相同 。 


1) 基本 表 

基本 表 是 关系 数据 库 中 实际 存在 的 表 , 是 实际 存储 数据 的 逻辑 表示 。 

2) 视图 表 

视图 表 是 由 基本 表 或 其 他 视图 表 导 出 的 表 。 视 图 表 是 为 了 方便 数据 查询 .数据 处 理 及 
数据 安全 要 求 而 设计 的 ,是 虚 表 , 它 不 对 应 实际 存储 的 数据 。 由 于 视图 表 依附 于 基本 表 , 可 
以 利用 视图 表 进 行 数据 查询 ,或 利用 视图 表 对 基本 表 进 行 数据 维护 ,但 视图 本 身 不 需要 进行 
数据 维护 (相关 定义 在 3. 5 节 中 有 详细 论述 )。 

3) 查询 表 

查询 表 是 指 查询 结果 对 应 的 表 , 或 查询 中 生成 的 临时 表 。 由 于 关系 运算 是 集合 运算 ,在 
关系 操作 过 程 中 会 产生 一 些 临时 表 , 称 为 查询 表 。 尽 管 这 些 查询 表 是 实际 存在 的 表 , 但 其 数 
据 可 以 从 基本 表 中 再 抽取 , 且 一 般 不 再 重复 使 用 ,所 以 查询 表 具 有 宛 余 性 和 一 次 性 ,可 以 认 
为 它们 是 关系 数据 库 的 派生 表 。 

3. 关系 的 性 质 

关系 数据 库 中 的 基本 表 具 有 以 下 6 个 性 质 。 

(1) 同一 属性 的 数据 具有 同 质 性 (Homogeneous) , 即 每 一 列 中 的 分 量 是 同一 类 型 的 数 
据 , 它 们 来 自 同一 个 域 。 

例如 ,学 生 选 课表 的 结构 为 : 选课 (学 号 ,课程 号 ,成 绩 ) ,其 “成 绩 ” 的 属性 值 不 能 有 百 分 
制 .5 分 制 * 及 格 ”" 和 “不 及 格 " 等 多 种 取 值 法 ,同一 关系 中 的 成 绩 必须 统一 语义 (例如 都 用 百 
分 制 ) ,否则 会 出 现存 储 和 数据 操作 错误 。 

(2) 同一 关系 的 属性 名 具有 不 可 重复 性 。 不 同 的 列 可 出 自 同 一 个 域 , 称 其 中 的 每 一 列 
为 一 个 属性 ,不同 的 属性 要 给 予 不 同 的 属性 名 。 这 是 由 于 关系 中 的 属性 名 是 标识 列 的 ,如 果 
在 关系 中 有 属性 名 重复 的 情况 , 则 会 产生 列 标识 混乱 问题 。 在 关系 数据 库 中 由 于 关系 名 也 
具有 标识 作用 ,所 以 允许 不 同 关系 中 有 相同 属性 名 的 情况 。 例 如 ,之 前 在 第 1 章 中 图 1-24 
所 示 的 例子 中 ,收入 和 扣除 都 取 自 “货币 域 ”, 为 了 避免 混 消 , 必 须 给 这 两 个 属性 取 不 同 的 属 
性 名 ,而 不 能 直接 使 用 域名 。 例 如 ,定义 收入 属性 名 为 “工资 ”, 扣 除 属性 名 为 “扣除 ”。 

(3) 列 的 顺序 无 所 谓 , 即 列 的 次 序 可 以 互 换 。 

关系 中 的 列 的 次 序 可 以 任意 交换 .重新 组 织 ,属性 顺序 对 于 使 用 来 说 是 无 关 紧要 的 。 
此 在 许多 实际 关系 数据 库 产品 中 ,增加 新 属性 时 ,永远 是 插 至 最 后 一 列 。 

另外 ,对 于 两 个 关系 ,如 果 属 性 个 数 和 性 质 一 样 , 只 有 属性 排列 顺序 不 同 , 则 这 两 个 关系 
的 结构 应 该 是 等 效 的 ,关系 的 内 容 应 该 是 相同 的 。 

(4) 任意 两 个 元 组 的 候选 码 不 能 相同 。 

关系 中 的 任意 两 个 元 组 不 能 完全 相同 , 即 关系 中 不 能 有 重复 的 元 组 。 

由 于 关系 中 的 一 个 元 组 表示 现实 世界 中 的 一 个 实体 或 一 个 具体 联系 ,元 组 重复 则 说 明 
一 个 实体 重复 存储 。 实 体重 复 不 仅 会 增加 数据 库 的 宛 余 ,还 可 能 使 数据 查询 和 统计 的 结果 
出 现 错误 ,也 可 能 造成 数据 不 一 致 的 问题 。 所 以 数据 库 中 应 当 绝 对 避免 元 组 重复 现象 ,确保 
实体 的 唯一 性 和 完整 性 。 

(5) 关系 中 的 元 组 位 置 具 有 顺序 无 关 性 ,即行 的 次 序 可 以 互 换 。 

关系 中 元 组 的 顺序 可 以 任意 交换 。 在 使 用 中 可 以 按 各 种 排序 要 求 对 元 组 的 次 序 重新 排 
列 , 例 如 ,对 选课 表 中 数据 可 以 按 成 绩 的 升序 或 降序 来 重新 组 织 数据 ,由 一 个 关系 可 以 派生 
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出 多 种 排序 表 形 式 。 由 于 关系 数据 库 技术 可 以 使 这 些 排序 表 在 关系 操作 时 完全 等 效 ,而 且 
数据 排序 操作 比较 容易 实现 ,所 以 我 们 不 必 担 心 关系 中 元 组 排列 的 顺序 会 影响 数据 操作 或 
影响 数据 输出 形式 ,基本 表 的 元 组 顺序 无 关 性 减少 了 不 必要 的 重复 关系 。 

(6) 分 量 原子 性 , 即 每 一 个 分 量 都 必须 是 不 可 分 的 数据 项 。 

关系 模型 要 求 关系 必须 是 规范 化 (Normalization) 的 , 即 要 求 关 系 必须 满足 一 定 的 规 
范 条 件 。 这 些 规范 条 件 中 最 基本 的 一 条 就 是 ,关系 的 每 一 个 分 量 必须 是 一 个 不 可 分 的 数 
据 项 。 

规范 化 的 关系 简称 为 范式 (Normal Form) 。 范 式 的 概念 将 在 第 4 章 中 做 详细 的 阐述 。 

【 例 1】 如 表 2-3 ,虽然 很 好 地 表达 了 学 生 与 成 绩 之 间 的 一 对 多 关系 ,但 由 于 属性 ”成 
绩 ” 中 分 为 C 语言 和 Pascal 语言 两 门 课 的 成 绩 , 这 种 组 合 数据 项 不 符合 关系 规范 化 的 要 求 ， 
这 样 的 关系 在 数据 库 中 是 不 允许 存在 的 。 通 俗 地 讲 , 不 允许 * 表 中 有 表 ”。 直 观 地 描述 ， 
表 2-3 中 还 有 一 个 小 表 。 该 表 正 确 的 设计 格式 如 表 2-4 所 示 。 

表 2-3 非 规范 化 的 关系 结构 


姓名 所 在 学 院 
C 语 言 Pascal 语言 

李 艺 信息 学 院 63 80 

王 一 信息 学 院 72 65 

表 2-4 修改 后 规范 化 的 关系 结构 

姓名 所 在 学 院 C 语言 成 绩 Pascal 语言 成 绩 
李 艺 信息 学 院 63 80 

王 一 信息 学 院 72 65 


注意 : 在 许多 实际 关系 数据 库 产 品 中 ,基本 表 并 不 完全 具有 这 6 条 性 质 。 例 如 ,有 的 数 
据 库 产品 仍然 区 分 了 属性 顺序 和 元 组 的 顺序 ; 有 的 关系 数据 库 产品 中 允许 关系 表 中 存在 两 
个 完全 相同 的 元 组 ,除非 用 户 特 别 定义 了 相应 的 约束 条 件 。 


2.1.2 关系 模式 


通过 之 前 对 关系 的 定义 我 们 了 解 到 ,关系 实质 上 是 一 张 二 维 表 , 表 的 每 一 行为 一 个 元 
组 ,每 一 列 为 一 个 属性 ,关系 是 元 组 的 集合 。 因 此 关系 模式 (Relational Scheme) 必 须 指出 这 
个 元 组 集合 的 结构 , 即 它 由 哪些 属性 构成 ,这 些 属性 来 自 哪 些 域 ,以 及 属性 与 域 之 间 的 映像 
关系 。 

关系 模式 是 关系 结构 的 描述 和 定义 ,是 对 二 维 表 的 表 结构 的 定义 。 

在 数据 库 中 要 区 分 型 和 值 概念 。 在 关系 数据 库 中 ,关系 模式 是 型 ,关系 是 值 。 关 系 模型 
是 对 关系 的 描述 ,那么 一 个 关系 需要 描述 哪些 方面 呢 ? 

定义 2.4 关系 的 描述 称 为 关系 模式 。 它 可 以 形式 化 地 表示 为 : 

R(U,D,DOM, F) 
其 中 : R 为 关系 名 , 它 是 关系 的 形式 化 表示 ; U 为 组 成 该 关系 的 属性 集合 ; D 为 属性 


组 U 中 属性 所 来 自 的 域 ;: DOM 为 属性 向 域 的 映像 集合 ; 下 为 属性 间 数 据 的 依赖 关系 
集合 。 

【 例 2】 在 上 面 学 生 选 课 关 系 中 ,如 表 2-4, 由 于 C 语言 成 绩 与 Pascal 语言 成 绩 出 自 同 
一 个 域 一 一 成 绩 域 ,一 般 取 正 整 数 集合 ,所 以 要 取 不 同 的 属性 名 ,并 在 模式 中 定义 属性 向 域 
的 映像 , 即 说 明 它们 分 别 出 自 哪个 域 ,如 : 

DOM(C 语言 一 正 整数 ) 二 DOM(Pascal 语言 一 正 整 数 )== 正 整数 

例如 : 如 图 1-4 所 示 的 学 生 基 本 情况 表 关 系 模型 可 以 表示 为 : RC(U,D,DOM,F) 

R 为 学 生 基 本 情况 表 ; 

器 为 (学 号 ,姓名 ,性 别 ,年 龄 ,所 属 学 院 , 入 学 时 间 , 家 庭 地 址 ,联系 电话 ); 

D 为 学 号 来 自 于 正 整数 域 ; 姓名 来 自 于 姓氏 及 名 字 的 集合 ; 年 龄 的 域 是 (10 一 50); 性 
别 域 是 ( 男 , 女 ); 所 属 学 院 的 域 是 学 校内 所 有 的 院 系 集合 ; 入 学 时 间 是 从 现在 算 起 四 年 内 
的 时 间 ; 家 庭 地 址 的 域 是 所 有 地 名 的 集合 ,联系 电话 是 电话 号 码 的 集合 ; 

DOM 为 (学 号 : INT 10; 姓名 : CHAR 8; 年 龄 : INT 2 (10 一 50); 性 别 : CHAR 2 
( 男 , 女 ); 所 属 院 系 : CHAR 20; 家 庭 地 址 : CHAR 40; 联系 电话 : INT12) 。 

说 明 : 一 个 汉字 用 两 位 字符 表示 。 

F 为 { 主 码 学 号 决定 其 他 各 属性 等 } ,属性 间 的 数据 依赖 将 在 第 4 章 讨 论 。 本 章 中 关系 
模式 仅 涉及 关系 名 、 各 属性 名 、 域 名 、 属 性 向 域 的 映像 四 部 分 , 即 RC(U,D,DOM)。 

关系 模式 通常 可 以 简单 记 为 RCU) 或 RCA ,As，,… ,A,)。 

其 中 R 为 关系 名 ,U 代表 属性 全 集 , Al ,As,…,A, 为 属性 名 ,域名 及 属性 向 域 的 映像 常 
常 直 接 说 明 为 属性 的 类 型 .长度 。 

如 学 生 关 系 模式 可 简 记 为 学 生 ( 学 号 ,姓名 ,性 别 ,年 龄 ,所 属 院 系 , 入 学 时 间 , 家 庭 
地 址 ) 。 

关系 模型 是 用 表 结 构 表 示 实 体 集 与 实体 集 之 间 联 系 的 一 种 模型 。 

关系 模式 描述 的 是 关系 的 框架 或 结构 。 关 系 是 按 关系 模式 组 织 的 表格 ,关系 既 包括 结 
构 也 包括 其 数据 。 一 般 讲 ,关系 模式 是 静态 的 、 稳 定 的 ,关系 数据 库 一 旦 定义 后 ,其 结构 不 能 
随意 改动 。 而 关系 是 动态 的 ,关系 是 关系 模式 在 某 一 时 刻 的 状态 或 内 容 , 因 为 关系 操作 在 不 
断 地 更 新 着 数据 库 中 的 数据 ,随时 间 的 变化 ,关系 数据 库 中 的 数据 需要 不 断 增 加 、 修 改 或 
删除 。 

现实 世界 随 着 时 间 在 不 断 地 变化 ,因而 在 不 同 的 时 刻 ,关系 模式 的 关系 也 会 有 所 变化 。 
但 是 ,现实 世界 的 许多 已 有 事实 限定 了 关系 模式 所 有 可 能 的 关系 必须 满足 一 定 的 完整 性 约 
东 条 件 ,这 些 约 束 或 者 通过 对 属性 取 值 范围 的 限定 ,例如 职工 年 龄 小 于 60 岁 (60 岁 以 后 退 
休 ) ,或 者 通过 属性 间 的 相互 关联 (主要 体现 于 值 的 相等 与 否 ) 反 映 出 来 。 关 系 模式 应 当 刻 画 
出 这 些 完整 性 约束 条 件 。 


2.1.3 关系 数据 库 


关系 数据 库 (Relation Database) 是 对 应 于 一 个 关系 模型 的 某 应 用 领域 全 部 关系 的 集 
合 , 它 是 基于 关系 模型 的 数据 库 。 在 关系 数据 库 中 ,实体 集 以 及 实体 之 间 的 联系 都 是 用 关系 
来 表示 的 。 关 系数 据 库 也 分 型 和 值 的 区 别 。 关 系数 据 库 模式 是 关系 数据 库 的 型 ,是 关系 模 
式 的 集合 ,是 对 关系 数据 库 结 构 等 的 描述 ,关系 数据 库 模式 包括 : 
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@ 若干 域 的 定义 ; 

@ 在 这 些 域 上 定义 的 若干 关系 模式 。 

关系 数据 库 的 值 是 这 些 关 系 模式 在 某 一 时 刻 对 应 关系 的 集合 ,也 就 是 所 说 的 关系 数据 
库 的 数据 。 

术语 之 间 的 联系 : 

。 一 个 关系 只 能 对 应 一 个 关系 模式 。 

。 一 个 关系 模式 可 对 应 多 个 关系 。 

。 关系 模式 是 关系 的 型 , 按 其 型 装 和 数据 值 后 即 形成 关系 。 
关系 模式 是 相对 静态 的 、 稳 定 的 ,而 关系 是 动态 的 、 随 时 间 变 化 的 。 
一 个 具体 的 关系 数据 库 是 若干 相关 关系 的 集合 。 
。 关系 数据 库 模型 的 结构 是 若干 相关 关系 模式 的 集合 。 


2.2 关系 操作 


关系 模型 由 关系 数据 结构 ,关系 操作 集合 和 关系 完整 性 约束 三 部 分 组 成 。 上 一 节 我 们 
讨论 了 关系 数据 结构 ,这 一 节 将 着 重 讲解 关系 操作 的 一 般 概念 和 分 类 。 

关系 模型 与 其 他 数据 模型 相 比 ,最 大 的 特点 是 关系 数据 操作 语言 。 关 系 操作 语言 灵活 
方便 ,表达 能 力 和 功能 都 非常 强大 。 

关系 模型 给 出 了 关系 操作 能 力 的 说 明 , 即 让 我 们 了 解 关系 操作 都 能 完成 哪些 功能 ,但 由 
于 不 同 的 RDBMS 可 以 定义 和 开发 不 同 的 语言 来 实现 这 些 操作 ,因此 我 们 不 对 RDBMS 语 
言 给 出 具体 的 语法 要 求 。 


2.2.1 基本 的 关系 操作 


关系 操作 采用 集合 操作 方式 , 即 操作 的 对 象 和 结果 都 是 集合 ,这 种 操作 方式 也 称 为 一 次 
一 个 集合 的 方式 。 相 应 地 , 非 关系 数据 模型 的 数据 操作 则 为 一 次 一 记录 的 方式 。 

关系 模型 中 常用 的 关系 操作 包括 查询 操作 和 数据 更 新 两 大 类 。 

数据 查询 (query) : 该 操作 主要 涉及 关系 属性 的 指定 、 元 组 的 选择 ,两 个 关系 的 合并 与 
连接 等 。 关 系 的 查询 表达 能 力 很 强 , 是 关系 操作 中 最 主要 的 部 分 。 查 询 操作 又 可 以 分 为 选 
择 (Select)、 投影 (Project)、 连接 (Join)、 除 (Divide)、 并 (Union)、 差 (Except)、 交 
(JIntersection)、 笛 卡 儿 积 (Cartesian Product) 等 。 

数据 更 新 : 主要 操作 包括 在 关系 中 插入 (Insert)、 删除 (Delete) 及 修改 (Update) 元 组 等 
内 容 。 

其 中 选择 、 投 影 .并 、 差 . 笛 卡 儿 积 是 5 种 基本 操作 。 复 杂 的 关系 数据 操作 可 通过 五 种 基 
本 运算 来 定义 和 获得 ,就 像 乘 法 可 以 用 加 法 来 定义 和 导出 一 样 。 

此 外 ,还 需要 有 关系 的 操作 规则 及 具体 的 关系 数据 语言 来 实现 这 些 操作 。 


2.2.2 关系 操作 的 特点 
关系 操作 的 特点 有 以 下 3 点 。 


1) 关系 操作 语言 -操作 一 体 化 

关系 语言 具有 数据 定义 数据 查询 ,数据 更 新 和 数据 控制 一 体 化 的 特点 。 关 系 操作 语言 
可 以 作为 独立 语言 交互 使 用 ,也 可 以 作为 宿主 语言 嵌入 到 主语 言 中 。 关 系 操作 的 这 一 特点 
使 得 关系 数据 库 语 言 容 易学 习 , 使 用 方便 。 

2) 关系 操作 的 方式 是 一 次 一 集合 方式 

非 关系 模型 的 操作 是 一 次 一 记录 (Record-at-a-Time) 方 式 , 而 关系 操作 的 方式 则 是 一 次 
一 集合 (set-at-a-time) 方 式 , 即 关系 操作 的 对 象 和 结果 数据 都 是 集合 。 关 系 的 数据 结构 单一 
的 特点 ,虽然 能 够 使 其 利用 集合 运算 和 关系 规范 化 等 数学 理论 优化 和 处 理 关系 操作 ,但 同时 
又 使 得 关系 操作 与 其 他 系统 配合 时 产生 了 方式 不 一 致 的 问题 , 即 需要 解决 关系 操作 的 一 次 
一 集合 与 主语 言 一 次 一 记录 处 理 方式 的 矛盾 。 

3) 关系 操作 语言 是 高 度 非 过 程 化 的 语言 

关系 操作 语言 表达 能 力 和 功能 都 非常 强大 。 例 如 ,关系 查询 语言 集 检索 统计、 排序 等 
多 项 功能 为 一 条 语句 , 它 等 效 于 其 他 语言 的 三 大 段 程 序 。 用 户 使 用 关系 语言 时 ,只 需要 指出 
“做 什么 ”, 而 不 需要 指出 “怎么 做 ”。 数 据 存 取 路 径 的 选择 、 数 据 操作 方法 的 选择 和 优化 都 由 
DBMS 自动 完成 。 关 系 语言 的 这 种 高 度 非 过 程 化 的 特点 使 得 关系 数据 库 的 使 用 非常 简单 ， 
关系 系统 的 设计 也 比较 容易 ,这 种 优势 是 关系 数据 库 能 够 被 用 户 广 泛 接受 和 使 用 的 主要 
原因 。 

关系 操作 能 够 具有 高 度 非 过 程 化 特点 的 原因 有 以 下 两 点 。 

@ 关系 模型 采用 了 最 简单 的 ,规范 的 数据 结构 , 即 二 维 表 。 

@ 它 运 用 了 先进 的 数学 工具 一 一 集合 运算 和 谓词 运算 ,同时 又 创造 了 儿 种 特殊 关系 运 
算 一 一 投影 .选择 和 连接 运算 。 

关系 运算 可 以 对 二 维 表 进行 任意 的 分 割 和 组 装 , 并 且 可 以 随机 地 构造 出 各 式 各 样 用 户 
所 需要 的 表格 。 当 然 , 用 户 并 不 需要 知道 系统 在 里 面 是 怎样 分 割 和 组 装 的 ,他 只 需要 指出 他 
所 用 到 的 数据 及 限制 条 件 。 然 而 ,对 于 一 个 系统 设计 者 和 系统 分 析 员 来 说 ,只 知道 这 些 表面 
上 的 东西 是 不 够 的 ,还 必须 了 解 系统 内 部 的 情况 。 


2.2.3 关系 操作 语言 的 种 类 


关系 操作 语言 可 以 分 为 以 下 3 类。 

(1) 关系 代数 语言 。 

关系 代数 语言 是 用 对 关系 的 运算 来 表达 查询 要 求 的 语言 ,ISBL(Information System 
Base Language) 为 关系 代数 语言 的 代表 。 

(2) 关系 演算 语言 。 

关系 演算 语言 是 用 查询 得 到 的 元 组 应 满足 的 谓词 条 件 来 表达 查询 要 求 的 语言 。 关 系 演 
算 语 言 包括 : 

。 元 组 关系 演算 语言 ,例如 ALPHA 和 QUEL; 

。 域 关系 演算 语言 ,例如 QBE。 

元 组 演算 语言 的 谓词 变 元 的 基本 对 象 是 元 组 变量 ; 域 演算 语言 的 谓词 变 元 的 基本 对 象 
是 域 变量 。 

关系 代数 .元 组 关系 演算 和 域 关系 演算 均 是 抽象 的 查询 语言 ,这 些 抽象 的 语言 与 具体 的 
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DBMS 中 实现 的 语言 并 不 完全 一 样 , 但 它们 能 用 作 评 估 实 际 系统 中 查询 语言 能 力 的 标准 或 
基础 。 实 际 的 查询 语言 除了 提供 关系 代数 或 关系 演算 的 功能 外 ,还 提供 了 许多 附加 功能 , 例 
如 ,关系 赋值 .算术 运算 等 。 关 系 语言 是 一 种 高 度 非 过 程 化 的 语言 ,用 户 不 必 请 求 DBA 为 
其 建立 特殊 的 存 取 路 径 , 存 取 路 径 的 选择 由 DBMS 的 优化 机 制 来 完成 。 另 外 ,还 有 一 种 介 
于 关系 代数 和 关系 演算 之 间 的 语言 称 为 结构 化 查询 语言 。 

(3) 具有 关系 代数 和 关系 演算 双重 特点 的 语言 结构 化 查询 语言 (Structure Query 
Language,SQL) 。 

这 是 一 种 基于 映像 的 语言 , 它 是 一 种 具有 关系 代数 和 关系 演算 双重 特点 的 语言 。SQL 
包括 数据 定义 数据 操作 和 数据 控制 三 种 功能 ,具有 语言 简洁 、 易 学 易 用 的 特点 , 它 充分 体现 
了 关系 数据 库 语 言 的 特点 和 优点 ,是 关系 数据 库 的 标准 语言 。 

这 些 关系 数据 库 语言 的 共同 特点 是 ,语言 具有 完备 的 表达 能 力 ,是非 过 程 化 的 集合 操作 
语言 ,功能 强 , 能 够 腻 入 到 高 级 语言 中 使 用 。 


2.3 关系 的 完整 性 约束 


为 了 维护 关系 数据 库 的 完整 性 和 一 致 性 ,数据 与 数据 的 更 新 操作 必须 遵守 关系 模型 的 
完整 性 规则 , 即 对 关系 的 某 种 约束 条 件 。 关 系 模型 中 有 三 类 完整 性 约束 : 实体 完整 性 ,参照 
完整 性 和 用 户 定义 的 完整 性 。 其 中 实体 完整 性 和 参照 完整 性 是 关系 模型 必须 满足 的 完整 性 
约束 条 件 ,应 该 由 RDBMS 自动 支持 ,被 称 作 是 关系 的 两 个 不 变性 。 用 户 定义 的 完整 性 是 应 
用 领域 需要 遵循 的 约束 条 件 ,体现 了 具体 领域 中 的 语义 约束 。 


2.3.1 实体 完整 性 


规则 2.1 实体 完整 性 (Entity Integrity) 规 则 , 若 属性 ( 指 一 个 或 一 组 属性 )A 是 基本 关 
系 了 的 主 属性 , 则 A 不 能 取 空 值 。 

所 谓 空 值 (Null Value) 就 是 “不 知道 ?或 “不 存在 ”的 值 。 

按照 实体 完整 性 规则 的 规定 ,基本 关系 的 主 码 都 不 能 取 空 值 。 如 果 主 码 由 若干 属性 组 
成 , 则 所 有 这 些 主 属性 都 不 能 取 空 值 。 

说 明 : 

(1) 实体 完整 性 规则 是 针对 基本 关系 而 言 的 。 一 个 基本 表 通 常 对 应 现实 世界 的 一 个 实 
体 集 。 例 如 学 生 关系 对 应 于 学 生 的 集合 。 

(2) 实体 具有 唯一 性 标识 一 一 主 码 。 这 是 因为 现实 世界 中 的 实体 是 可 区 分 的 ,因此 它 
们 一 定 具 有 某 种 唯一 性 标识 。 组 成 主 码 的 各 属性 都 不 能 取 空 值 。 相 应 地 ,关系 模型 中 以 主 
码 作为 唯一 性 标识 。 

(3) 当 有 多 个 候选 码 时 , 主 码 中 的 所 有 属性 即 主 属性 都 不 能 取 空 值 。 如 果 主 属性 取 空 
值 , 就 说 明 存在 某 个 不 可 标识 的 实体 , 即 存在 不 可 区 分 的 实体 ,这 与 第 2 点 相 矛 盾 ; 而 主 码 
以 外 的 候选 码 上 可 取 空 值 。 

例如 学 生 选 课 关 系 一 一 选课 (学 号 ,课程 号 ,成 绩 ) 中 ,“ 学 号 和 课程 号 ”为 主 码 , 则 “学 号 ” 
和 “课程 号 ”两 个 属性 都 不 能 取 空 值 。 


【 例 3】 在 学 生 关 系数 据 库 中 ,关系 模式 分 别 为 : 


学 生 关系 S( 学 号 ,姓名 , 借 书 卡号 ,性 别 ,年 龄 ,专业 号 ,入 学 时 间 , 家 庭 地 址 ) 

课程 关系 C( 课 程 号 .课程 名 ,学 分 .选修 课 ) 

选课 关系 SC( 学 号 .课程 号 ,成绩 ) 

说 明 : 带 下 画 线 的 属性 为 对 应 关系 的 主 码 。 

在 学 生 关系 S 中 ,“ 学 号 ”为 主 码 , 则 它 不 能 取 空 值 。 若 为 空 值 ,说 明 存在 不 可 区 分 的 实 
体 , 则 实体 不 完整 。 而 候选 码 “ 借 书 卡号 "在 未 发 借 书 卡 时 , 则 可 为 空 。 

实体 完整 性 规则 规定 基本 关系 主 码 上 的 每 一 个 属性 都 不 能 取 空 值 ,而 不 仅 是 主 码 整 体 
不 能 为 空 值 。 如 选课 关系 SC 中 “学 号 ”与 “课程 号 "为 主 码 , 则 两 个 属性 都 不 能 取 空 值 。 


2.3.2 参照 完整 性 


现实 世界 中 的 实体 都 不 是 孤立 存在 的 ,它们 之 间 往 往 存在 某 种 联系 ,并 且 在 关系 模型 中 
实体 及 实体 间 的 联系 都 是 用 关系 来 描述 的 ,这 样 就 自然 存在 着 关系 与 关系 间 的 引用 。 在 介 
绍 关系 模型 的 参照 完整 性 (Referential Integrity) 规 则 之 前 , 先 来 了 解 以 下 两 个 概念 。 

1 外 码 和 参照 关系 

定义 2.5 设 上 是 基本 关系 有 的 一 个 或 一 组 属性 ,但 不 是 关系 R 的 码 。K, 是 基本 关系 
S 的 主 码 。 如 果 下 与 K, 相对 应 , 则 称 下 是 R 的 外 码 引用 


(Foreign Key)。 并 称 基 本 关系 R 为 参照 关系 pe 
(Referencing Relation), 基本 关系 S 为 被 参照 关系 


(Referenced Relation ) 或 目标 关系 (Target Relation ) 。 See) We 
如 图 2-3 所 示 为 外 码 与 参照 关系 的 示意 图 。 参照 关系 被 参照 关系 
下 面 通过 儿 个 例子 来 进一步 说 明 外 码 与 参照 关系 图 2-3 ”外 码 与 参照 关系 


【 例 4】 学 生 实体 和 专业 实体 可 以 用 下 面 的 关系 来 表示 ,其 中 主 码 用 下 面 线 标 出 。 

学 生 关系 S( 学 号 ,姓名 , 借 书 卡号 ,性 别 ,年 龄 ,专业 号 ,人 学 时 间 , 家 庭 地址 ) 

专业 (专业 号 ,专业 名 ) 

在 学 生 关系 里 ,专业 号 不 是 主 码 , 但 在 专业 关系 里 专业 号 是 主 码 。 这 两 个 关系 存在 着 属 
性 的 引用 , 即 学 生 关系 引用 了 专业 关系 的 主 码 * 专 业 号 "。 则 学 生 关系 中 的 属性 * 专 业 号 "为 
学 生 关系 的 外 码 ,学 生 关系 为 参照 关系 ,专业 关系 为 被 参照 关系 。 显 然 ,学 生 关系 中 的 “专业 
号 " 值 必 须 是 实际 存在 的 专业 的 专业 号 。 也 就 是 说 ,学 生 关系 中 的 专业 号 的 取 值 需要 参照 专 
业 关 系 的 专业 号 属性 取 值 。 专 业 关系 不 存在 的 值 学 生 关系 不 能 引用 ,如 图 2-4(a) 所 示 。 

以 上 例子 是 两 个 关系 间 的 引用 关系 ,下 面 看 一 个 三 个 关系 之 间 的 引用 例子 。 

【 例 5】 学 生 、 课 程 ,学 生 与 课程 之 间 的 多 对 多 联系 可 以 如 下 3 个 关系 表示 ,其 中 主 码 
用 下 夯 线 标 出 。 

学 生 关系 S( 学 号 ,姓名 , 借 书 卡号 ,性 别 ,年 龄 ,专业 号 ,和 学 时 间 ,家 庭 地 址 ) 


课程 关系 C( 课 程 号 ,课程 名 ,学 分 ,选修 课 ) 
选课 关系 SC( 学 号 ,课程 号 ,成 绩 ) 


在 选课 关系 SC 中 ,“ 学 号 ”和 “课程 号 ” 合 在 一 起 为 该 关系 的 主 码 。 单 独 的 学 号 或 课程 
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号 仅 为 选课 关系 的 主 属性 ,而 不 是 关系 的 主 码 。 由 于 在 学 生 表 中 “学 号 ”是 主 码 ,在 课程 表 中 
“课程 号 ”也 是 主 码 ,选课 关系 的 “学 号 ”引用 了 学 生 关系 的 主 码 “ 学 号 ”, 并 且 选 课 关 系 的 “ 课 
程 号 ”引用 了 课程 关系 的 主 码 “ 课 程 号 ”。 因 此 ,“ 学 号 ”和 “课程 号 ”为 选课 关系 中 的 外 码 。 选 
课 关系 为 参照 关系 ,而 学 生 关 系 和 课程 关系 为 被 参照 关系 。 选 课 关系 中 的 “学 号 ” 值 必须 是 
确实 存在 的 学 生 的 学 号 , 即 学 生 关系 中 有 该 学 生 的 记录 ; 同样 选课 关系 中 的 “课程 号 " 值 同 
样 也 必须 是 确实 存在 的 课程 关系 的 课程 号 , 即 课程 关系 中 有 该 课程 的 记录 。 换 句 话说 ,选课 
关系 中 某 些 属性 的 取 值 需要 参照 学 生 关系 和 课程 关系 的 属性 取 值 ,如 图 2-4(b) 所 示 。 

不 仅 两 个 或 两 个 以 上 的 关系 间 可 以 存在 引用 关系 ,同一 关系 内 部 属性 间 也 可 能 存在 引 
用 关系 。 

【 例 6】 在 之 前 的 学 生 关系 中 ,增加 一 个 属性 “班长 学 号 ”, 即 : 

学 生 关系 S( 学 号 ,姓名 , 借 书 卡号 ,性 别 ,年 龄 ,专业 号 ,入 学 时 间 , 家庭 地 址 ,班长 学 
号 )。 在 该 学 生 关系 中 “学 号 ”属性 仍然 是 主 码 ,“ 班 长 学 号 ”属性 表示 该 班级 的 班长 的 学 号 ， 
它 引 用 了 本 关系 “学 号 ”属性 , 即 “班长 学 号 ”必须 是 确实 存在 的 学 生 的 学 号 。“ 班 长 学 号 " 属 
性 与 本 身 的 主 码 “ 学 号 ”属性 相对 应 ,因此 “班长 学 号 ”是 该 关系 外 码 。 这 里 ,学生 关系 既是 参 
照 关系 也 是 被 参照 关系 。 如 图 2-4(c) 所 示 。 


9 外 码 
学 生 关系 ( 经 台 姓名 ,性 别 ,年 铃 《 志 业 从 


一 一 参 昭 关系 
专业 (和 E 业 全 一 被 参照 关系 
(a) 
被 参照 关系 


学 生 关系 S ( 学 号 、 姓 名 ， 年 龄 ， 专 业 号 ) 课程 关系 C ( 课程 号 ， 课 程 名 ， 学 分 ， 选 修 课 ) 
引用 引 


选课 关系 SC(CES 、 课 程 号 > 成 绩 ) ”一 一 一 参照 关系 


外 码 
(b) 


图 2-4 关系 的 参照 图 


需要 注意 的 是 : 

(1) 关系 R 和 S 不 一 定 是 不 同 的 关系 ,参照 关系 和 被 参照 关系 可 能 是 同一 个 关系 ,如 
例 6。 

(2) 外 码 并 不 一 定 要 与 相应 的 主 码 同 名 。 同 样 如 例 6 中 ,学 生 关系 的 主 码 名 为 "学 号 ”， 
外 码 为 “班长 学 号 ”"。 不 过 ,在 实际 应 用 中 ,为 了 便于 识别 , 当 外 码 与 相应 的 主 码 不 属于 同一 
关系 时 ,往往 它们 使 用 相同 的 名 字 。 

说 明 : 主 码 K 和 外 码 下 必须 定义 在 相同 域 上 ,它们 相对 应 即 有 引用 关系 。 参 照 完整 性 


规则 就 是 定义 外 码 与 主 码 之 间 的 引用 规则 。 

这 三 个 例子 说 明 关系 与 关系 之 间 存 在 着 相互 引用 、 相 互 约束 的 情况 。 下 面 给 出 表达 关 
系 之 间 相互 引用 约束 的 参照 完整 性 的 规则 。 

规则 2.2 ”参照 完整 性 规则 : 若 属性 (或 属性 组 )F 是 基本 关系 R 的 外 码 , 它 与 基本 关系 
S 的 主 码 K, 相对 应 (基本 关系 R 和 S 不 一 定 是 不 同 的 关系 ), 则 对 于 R 中 每 个 元 组 在 F 上 
的 值 必须 为 : 

。 或 者 取 空 值 (F 的 每 个 属性 值 均 为 空 值 ) 
或 者 非 空 值 ,该 值 等 于 S 中 某 个 元 组 的 主 码 值 。 

下 面 针 对 例 4 一 例 6 ,我 们 做 进一步 的 分 析 来 充分 理解 参照 完整 性 规则 。 

对 于 例 4, 学 生 关系 中 每 个 元 组 的 “专业 号 ?属性 只 能 取 以 下 两 类 值 ; 

(1) 空 值 ,表示 尚未 给 该 学 生 分 配 专业 ; 

(2) 非 空 值 , 该 值 必须 是 专业 关系 中 某 个 元 组 的 “专业 号 ” 值 。 一 个 学 生 不 可 能 分 配 到 
一 个 不 存在 的 专业 中 , 即 被 参照 关系 “专业 ”中 一 定 存在 一 个 元 组 , 它 的 主 码 值 等 于 该 参照 关 
系 “ 学 生 ” 中 的 外 码 值 。 

对 于 例 5, 选 课 关 系 中 的 “学 号 ”与 学 生 关 系 中 的 主 码 “ 学 号 ”相对 应 ,选课 关系 中 的 “ 课 

程 号 ”与 课程 关系 中 的 主 码 “ 课 程 号 ”相对 应 ,因此 它们 均 是 外 码 。 根 据 参 照 完 整 性 规则 , 它 

们 要 么 是 空 值 ,要 么 引用 对 应 关系 中 实际 存在 的 主 码 值 。 但 由 于 选课 关系 自身 的 主 码 为 “学 
号 ”与 “课程 号 ”, 又 根据 实体 完整 性 规则 ,它们 均 不 能 为 空 。 所 以 选修 关系 中 的 “学 号 "和 * 课 
程 号 ”属性 实际 上 只 能 取 对 应 目标 关系 中 的 实际 值 ,而 不 能 取 空 值 。 

对 于 例 6, 参 照 关系 与 被 参照 关系 可 以 是 同一 个 关系 ,按照 参照 完整 性 规则 ,“ 班 长 学 
号 ”属性 值 可 以 取 两 类 值 。 

(1) 空 值 ,表示 该 学 生 所 在 班级 尚未 选 出 班长 。 

(2) 非 空 值 ,这 时 该 值 必须 是 本 关系 中 某 个 元 组 的 学 号 值 。 

参照 完整 性 又 称 为 引用 完整 性 , 它 定 义 了 外 码 与 主 码 之 间 的 引用 规则 。 

外 码 与 主 码 提供 了 一 种 表示 元 组 之 间 联 系 的 手段 。 外 码 要 么 取 空 值 ,要 么 引用 一 
际 存在 的 主 码 值 。 

实体 完整 性 约束 是 对 关系 的 内 部 制约 ,参照 完整 性 约束 是 不 同 关系 之 间或 一 个 关系 的 
不 同属 性 之 间 的 制约 。 


2.3.3 用 户 定义 的 完整 性 


任何 关系 数据 库 系 统 都 应 当 具备 实体 完整 性 和 参照 完整 性 。 这 是 关系 模型 必须 支持 的 
完整 性 要 求 。 

除外 ,由 于 不 同 的 关系 数据 库 系统 有 着 不 同 的 应 用 环境 ,所 以 它们 要 有 不 同 的 约束 条 
件 。 用 户 定义 的 完整 性 就 是 针对 某 一 具体 关系 数据 库 的 约束 条 件 所 涉及 的 数据 必须 满足 的 
语义 要 求 条 件 。 例 如 某 个 属性 必须 取 唯 一 值 (例如 专业 关系 中 的 专业 名 ); 某 个 非 主 属性 也 
不 能 取 空 值 。 例 3 的 学 生 关系 中 必须 给 出 学 生 姓 名 ,就 可 以 要 求学 生 姓 名 不 能 取 空 值 ;“ 性 
别 " 的 取 值 只 能 为 * 男 "和 *“ 女 ”; 选课 关系 中 的 成 绩 为 0 一 100; 更 新 学 生 关 系 时 ,年 龄 属性 值 
通常 只 增加 ,不 能 减少 等 等 。 

关系 模型 应 提供 定义 和 检验 这 类 完整 性 的 机 制 , 以 便 用 统一 的 方法 处 理 它们 ,而 不 要 由 
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应 用 程序 承担 这 一 功能 。 

在 早期 的 RDBMS 中 没有 提供 定义 和 检验 这 些 完整 性 的 机 制 ,因此 需要 应 用 开发 人 员 
在 应 用 系统 的 程序 中 进行 检查 。 例 如 例 3 的 选修 关系 中 ,每 插入 一 条 记录 ,必须 在 应 用 程序 
中 写 一 段 程序 来 检查 其 中 的 学 号 是 否 等 于 学 生 关系 中 的 某 个 学 号 ,检查 其 中 的 课程 号 是 否 
等 于 课程 关系 中 的 某 个 课程 号 。 如 果 等 于 , 则 插入 这 一 条 选修 记录 ,否则 就 拒绝 插入 ,并 给 
出 错误 信息 。 

关系 数据 库 系 统一 般 包 括 以 下 几 种 用 户 定义 的 完整 性 约束 : 

@ 定义 属性 是 否 允 许 为 空 值 ; 

@ 定义 属性 值 的 唯一 性 ; 

@ 定义 属性 的 取 值 范围 ; 

@ 定义 属性 的 缺 省 值 ; 

@ 定义 属性 间 的 函数 依赖 关系 。 

总 之 ,关系 数据 模型 中 存在 完整 性 约束 。 为 了 保持 数据 库 的 一 致 性 和 正确 性 ,必须 使 数 
据 库 中 的 数据 满足 完整 性 约束 。 


2.4 关系 代数 


在 2.2.3 节 介 绍 的 数据 语言 种 类 中 我 们 了 解 到 关系 数据 语言 (也 称 数 据 库 操作 语言 ) 是 
数据 库 管 理 系统 提供 的 用 户 接口 ,是 用 户 用 来 操作 数据 库 的 工具 。 而 关系 代数 作为 关系 数 
据 模型 最 重要 的 数据 操作 语言 ,是 一 种 抽象 的 查询 语言 ,是 关系 数据 操纵 语言 的 一 种 传统 表 
达 方 式 , 它 是 通过 对 关系 的 运算 来 表达 查询 的 。 

关系 代数 是 一 组 施 于 关系 上 的 高 级 运算 ,每 个 运算 都 以 一 个 或 多 个 关系 作为 它 的 运算 
对 象 ,并 生成 另外 一 个 关系 作为 该 运算 的 结果 。 所 以 它 是 对 关系 的 操作 。 因 此 运算 对 象 . 运 
算 符 、 运 算 结 果 是 关系 代数 的 三 大 要 素 。 

刚才 提 到 ,关系 代数 的 运算 对 象 和 运算 结果 都 是 关系 ,那么 关系 代数 用 到 的 运算 符 又 包 
括 哪些 呢 ? 

关系 代数 用 到 的 运算 符 包 括 四 类 : 集合 运算 符 专门 的 关系 运算 符 、 算 术 比 较 符 和 逮 辑 
运算 符 , 如 表 2-5 所 示 。 


表 2-5 关系 代数 常用 的 运算 符 


并 
差 
交 
广义 第 卡 儿 积 
选择 


专门 的 关系 运算 符 


小 | 又 | Sas | x|>| ic 


续 表 


运 算 符 会 释 
大 于 
大 于 或 等 于 
小 于 
小 于 或 等 于 
等 于 
不 等 于 
非 
与 
或 


比较 运算 符 


lAIAIVIV 


人 
V 


4 


逻辑 运算 符 


一 | 二 


关系 代数 的 运算 按 运 算 符 的 不 同 可 分 为 传统 的 集合 运算 和 专门 的 关系 运算 两 类 操作 。 

其 中 传统 的 集合 运算 将 关系 看 成 元 组 的 集合 ,其 运算 是 从 关系 的 “水 平 "方向 (即行 的 角 
度 ) 来 进行 的 ; 而 专门 的 关系 运算 不 仅 涉及 行 而 且 还 涉及 列 。 比 较 运 算 符 和 逻辑 运算 符 用 
于 辅助 专门 的 关系 运算 。 任 何 一 种 运算 都 是 将 一 定 的 运算 符 作 用 于 指定 的 运算 对 象 上 ,从 
而 得 到 预期 的 运算 效果 。 所 以 ,运算 对 象 . 运 算 符 和 运算 结果 是 关系 运算 的 3 大 要 素 。 

关系 代数 的 运算 可 以 分 为 基本 运算 、 附 加 运算 和 扩展 运算 。 关 系 代数 的 基本 运算 包括 
选择 、 投 影 .并 、 差 ,广义 笛 卡 儿 积 和 更 名 ,可 以 表达 任何 关系 代数 查询 ; 关系 代数 的 附加 运 
算 包括 交 、 自 然 连 接 、 除 和 赋值 ,用 来 对 复杂 的 关系 代数 表达 式 进行 简化 并 实现 查询 。 关 系 
代数 运算 对 象 是 关系 ,运算 结果 是 新 的 关系 。 因 此 一 个 运算 的 运算 结果 又 可 作为 男 一 运算 
的 操作 数 ,由 此 组 成 复杂 的 关系 代数 表达 式 。 


2.4.1 传统 的 集合 运算 


合 运 算 包 括 并 、 交 、 差 、 广 义 笛 卡 儿 积 四 种 运算 , 它 是 二 目 运 算 。 其 中 , 除 广 义 笛 卡 儿 
积 外 ,其 他 运算 中 参与 运算 的 两 个 关系 必须 是 相 容 的 同类 关系 。 所 谓 同类 关系 是 这 两 个 关 
系 必须 有 相同 的 目 n( 即 两 个 关系 有 相同 的 属性 ), 且 相应 的 属性 值 取 自 同一 个 域 (但 属性 的 
名 字 可 以 不 相同 )。 
现在 我 们 设 t 为 元 组 变量 ,R、S 为 同类 的 元 关系 ,可 以 定义 并 、 差 \ 交 、 笛 卡 儿 积 运算 
如 下 
1. 并 
关系 R 与 关系 S 的 并 (Union) 运 算 表 示 为 : 
RUS=1{ tltERVtES)} 
上 式 说 明 ,其 结果 仍 为 n 目 关系 ,是 由 属于 R 或 属于 S 的 元 组 组 成 。 
2. 差 
关系 及 与 关系 S 的 差 (Except) 运 算 表 示 为 : 
R—S={ tlt€E RAtES} 
上 式 说 明 , 其 结果 关系 仍 为 nn 目 关系 ,是 由 属于 R 而 不 属于 S 的 所 有 元 组 组 成 。 
3 区 
关系 及 与 关系 S 的 交 (Intersection) 运 算 表 示 为 : 
Rns ={tltERAtES} 


关系 数据 库 


地 凡 由 


数据 庄原 理 及 应 用 教程 一 -SQL Server 2014 


上 式 说 明 , 其 结果 关系 仍 为 n 目 关 系 ,是 由 既 属于 R 又 属于 S 的 元 组 组 成 。 关 系 的 交 


可 以 用 差 来 表示 , 即 RMS = R 一 (R 一 S)。 
4. 笛 卡 儿 积 


在 这 里 的 笛 卡 儿 积 (Cartesian Product) 严 格 地 讲 , 应 该 是 广义 的 笛 卡 儿 积 (Extended 
Cartesian Product) 。 因 为 这 里 笛 卡 儿 积 的 元 素 是 元 组 。 
关系 及 与 关系 S 的 广义 笛 卡 儿 积 运算 表示 为 : 
RXS={tt,|t, ERAtES) 
上 式 说 明 , 设 R 为 m 目的 关系 .有 个 元 组 ,S 为 n 目 关系 有 ks 个 元 组 .它们 的 广义 
笛 卡 儿 积 的 结果 关系 为 一 个 mw 十 n 目的 元 组 的 集合 ,元 组 的 前 mm 列 是 关系 R 的 一 个 元 组 ， 
后 nn 列 是 关系 S 的 一 个 元 组 ,共有 Xk, 个 元 组 。 每 个 元 组 由 前 mm 列 关 系 R 的 一 个 元 组 ， 


与 后 n 列 关系 S 的 一 个 元 组 拼接 而 成 。 


注意 : R、S 可 为 不 同类 关系 ,结果 为 不 同类 关系 。 当 需要 得 到 一 个 关系 信和 其 自身 的 


广义 黎 卡 儿 积 时 ,必须 引入 R 的 别名 ,比如 说 R', 把 表达 式 写 为 RXR' 或 R'XR。 
并 运算 、 交 运算 和 积 运 算 均 满 足 结 合 律 , 但 求 差 运算 不 满足 结合 律 。 


【 例 7】 
如 表 2-6 所 示 。 


表 2-6 传统 的 集合 运算 举例 


给 出 关系 和 S 的 原始 数据 ,它们 之 间 的 并 、 交 、 差 和 广义 笛 卡 儿 积 运算 结果 


R S 

A B C A B C 
a b c by 六 
a bz ca 

i | 而 al bs Ce 

RUS R 一 S 
A B C A B C 
al bi cr 
bi 
a 和 全 al 1 Cl 
az b; a 
b: 
aa 2 a 
RNS 
A B C 
a bz cz 
RxXS 
RR R.B [| .A S.B S. C 
al b a a bz cz 
a b a a bs cz 
a b; cz a b; cz 
a bs cz a bs cz 
az bz a a bs cz 
bs 


2.4.2 专门 的 关系 运算 


专门 的 关系 运算 包括 选择 ,投影 连接 \ 除 运算 等 。 为 了 叙述 上 的 方便 , 先 引 入 儿 个 记号 。 

1. 记号 说 明 

1) 关系 模式 、 关 系 、 元 组 和 分 量 

设 关系 模式 为 RCAl ,As,…,A,)。 它 的 一 个 关系 设 为 R,tER 表示 t 是 R 的 一 个 元 
组 。t[LA;] 则 表示 元 组 t 中 相应 于 属性 A; 的 一 个 分 量 (i 二 1,2,…,n)。 

2) 属性 列 和 非 属性 列 

车 A={An ,As ,…,Aak}, 其 中 Au ,Az,…,Ax 是 Al,As,…,A, 中 的 一 部 分 , 则 A 称 为 
属性 列 或 属性 组 。tLA]=(tLAa],tLAs],…'tLAs]) 表 示 元 组 t 在 属性 列 A 上 诸 分 量 的 集 
合 ,A 则 表示 {Al,As,… ,A,} 中 去 掉 {An ,As ，…,An} 后 剩余 的 属性 组 , 称 非 属性 列 。 

3) 元 组 连接 

RR 为 mn 目 关系 ,S 为 n 目 关系 ,t, ER,t,E€S,(tit.) 称 为 元 组 (Concatenation) 的 连接 或 
元 组 的 串 接 。 它 是 一 个 m 十 n 列 的 元 组 ,前 m 个 分 量 为 R 中 的 一 个 m 元 组 ,后 nn 个 分 量 为 
S 中 的 一 个 nn 元 组 。 

4) 象 集 

给 定 一 个 关系 R(X,Z),X 和 ZZ 为 属性 组 。 当 t[X] 二 x 时 ,x 在 R 中 的 象 集 (Images 
Set) 定 义 为 ， 

2Z.={t[Z]It€E R,t[X]=x} 

它 表示 R 中 属性 组 X 上 值 为 x 的 诸 元 组 在 Z 上 分 量 的 集合 。 

【 例 8】 图 2-5 中 ,x 在 R 中 的 象 集 Z ,一 1Z ,2 ,Z:)， 

xe 在 R 中 的 象 集 Z。 ,二 {2 ,23} 
xs 在 R 中 的 象 集 Z。 ,二 {2 ,2} 


R 
x ZZ 
x Zz 
x Zz 
x Z 
x 2 
x Z 
x ZL 
图 2-5 象 集 举例 


2. 专门 关系 运算 的 定义 
1) 选择 运算 
选择 运算 (Selection) 又 称 为 限制 运算 (Restriction) ,是 一 个 一 元 运算 。 它 在 关系 R 中 
选择 满足 给 定 条 件 的 元 组 , 记 作 : 
or(R)= 二 {t|1tERAF(t)==' 真 '} 
选择 运算 从 关系 R 中 选取 使 逻辑 表达 式 F 为 真 的 元 组 ,是 从 行 的 角度 进行 的 运算 。 
其 中 : o 表示 选择 运算 ， 
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F 是 选择 条 件 , 它 是 一 个 逻辑 表达 式 , 取 逻辑 值 * 真 "或 “ 假 ”; 

构成 逻辑 表达 式 下 的 基本 形式 为 X,0Y 。 

其 中 : 9 是 比较 运算 符 , 它 可 以 是 二 ,三 ,一 \ 三 二 或 一 二 中 的 一 个 ,X, 和 Yi 或 为 属性 
名 (属性 名 也 可 以 用 它 的 序号 来 蔡 代 ) ,或 为 常量 ,或 为 简单 函数 。F 由 逻辑 运算 符 ” ( 非 )、 
人 (与 ) 和 V (或 ) 以 及 圆 括号 将 原子 公式 连接 在 一 起 ,形成 了 复合 的 逻辑 表达 式 F。 

下 面 通过 具体 事例 说 明 投影 运算 。 

设 有 一 学 生 -课程 数据 库 , 它 包括 学 生 关系 .课程 关系 和 选课 关系 ,其 关系 模式 为 : 


学 生 (Sno, Sname, Sage, Ssex, Sdept) ; 
课程 (Cno, Cname, Cpno, Ccredit) 


选课 (Sno, Cno, Grade) 。 
如 表 2-7 一 表 2-9 所 示 ,为 以 上 关系 模式 的 具体 数值 。 
表 2-7 学 生 
Sno Sname Sage Ssex Sdept 
1703070101 李 艺 18 女 信息 学 院 
1703070211 王 一 19 男 信息 学 院 
1703070120 张 欣 18 男 信息 学 院 
1703070125 吴 波 19 男 信息 学 院 
1703070302 何 穗 18 女 信息 学 院 
1701030302 张 恒 17 女 机 械 学 院 
1701030322 赵 冬 20 男 机 械 学 院 
1702030315 张 坦 19 男 汽车 学 院 
1704030302 吴 桐 18 女 经 贸 学 院 
表 2-8 课程 
Cno Cname Cpno Ceredit 
03001 数据 库 原理 03005 7 
03002 计算 机 网 络 03004 7 
03003 C 语 言 程序 设计 03006 8 
03004 通信 原理 03006 8 
03005 数据 结构 03003 6 
03006 数学 12 
03007 信息 系统 03001 4 
表 2-9 选课 
Sno Cno Grade 
1703070101 03001 76 
1703070101 03002 80 
1703070101 03003 90 
1703070211 03001 90 
1703070211 03002 85 


1703070211 03003 80 


续 表 


Sno Cno Grade 
1703070125 03002 60 
1703070125 03004 80 
1701030302 03003 84 
1701030302 03006 54 
1701030322 03006 33 
1701030322 03001 57 

用 关系 代数 表示 下 列 操作 。 


【 例 9】 用 关系 代数 表示 在 学 生 -课程 数据 库 中 查询 信息 学 院 全 体 学 生 的 操作 。 
Gsdept 一 "信息 学 谋 " (学 生 ) 或 
05 一 “信息 学 院 " (学生 ) 
解 题 说 明 : 
其 中 下 角 标 “5” 为 所 属 学 院 属 性 的 序号 。 
运算 结果 如 表 2-10 所 示 。 
表 2-10 例 9 选择 举例 


Sno Sname Sage Ssex Sdept 
1703070101 李 艺 18 女 信息 学 院 
1703070211 和 19 男 信息 学 院 
1703070120 张 欣 18 男 信息 学 院 
1703070125 吴 波 19 男 信息 学 院 
1703070302 何 穗 18 女 信息 学 院 


【 例 10〗 用 关系 代数 表示 在 学 生 课 程 数据 库 中 查询 成 绩 小 于 60 分 的 记录 。 
GGrde<so( 选 课 ) 或 ”os<eo( 选 课 ) 
解 题 说 明 : 
其 中 下 角 标 “3” 为 成 绩 属性 的 序号 。 
运算 结果 如 表 2-11 所 示 。 
表 2-11 例 10 选择 举例 


Sno Cno Grade 
1701030302 03006 54 
1701030322 03006 33 
1701030322 03001 57 

2) 投影 运算 


关系 R 上 的 投影 (Projection) 是 从 R 中 选择 出 若干 属 性 列 组 成 新 的 关系 , 记 作 : 
IA(R)={tLAJItER} 

其 中 : A 为 人 中 的 属性 列 . 且 AEU。 

在 关系 二 维 表 中 ,选择 是 一 种 水 平 操作 , 它 针对 二 维 表 中 的 行 ; 而 投影 则 是 一 种 垂直 操 | 章 
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作 , 它 针对 的 是 二 维 表 中 的 属性 列 。 投 影 操 作 是 从 列 的 角度 进行 运算 。 
【 例 11】 在 学 生 -课程 数据 库 中 ,查询 学 生 的 姓名 和 所 在 学 院 , 即 求学 生 关 系 在 学 生 姓 
名 和 所 属 学 院 两 个 属性 上 的 投影 操作 ,表示 为 : 
IIsune,sieo( 学 生 ) 或 IL,; (学生 ) 
运算 结果 如 表 2-12 所 示 。 


表 2-12 例 11 投影 举例 


Sname Sdept Sname Sdept 
李 艺 信息 学 院 张 恒 机 械 学 院 
下 二 信息 学 院 赵 冬 机 械 学 院 
张 欣 信息 学 院 张 旭 汽车 学 院 
吴 波 信息 学 院 吴 桐 经 贸 学 院 
何 穗 信息 学 院 


投影 操作 之 后 不 仅 取消 了 关系 中 的 某 些 列 ,而 且 还 可 能 取消 某 些 元 组 ,因为 当 取消 了 某 
些 属性 之 后 ,就 可 能 出 现 重 复元 组 ,关系 操作 将 自动 取消 这 些 相 同 的 元 组 。 
【 例 12】 查询 学 生 关 系 中 都 有 哪些 学 院 , 即 查询 学 生 关系 上 所 在 学 院 属 性 上 的 投影 。 
sem (学 生 ) 
运算 结果 如 表 2-13 所 示 。 


表 2-13 例 12 投影 举例 


Sdept Sdept 
信息 学 院 汽车 学 院 
机 械 学 院 经 贸 学 院 


3) 连接 
连接 (Join) 又 称 为 0 连接 ,是 一 个 二 元 运算 , 它 从 两 个 关系 的 笛 卡 儿 积 中 选取 属性 间 满 
足 一 定 条 件 的 元 组 ,因此 可 以 认为 ,连接 运算 是 关系 代数 基本 运算 一 一 笛 卡 儿 积 和 选择 运算 
的 附加 运算 。 
两 个 关系 R 和 S 进行 连接 运算 记 为 : 
RPAS= {tt ERAt ESAtLAINLB]) 
其 中 : A 和 也 分 别 为 R 和 S 上 目 数 相等 且 可 比 的 属性 组 ,9 是 比较 运算 符 。 连 接 运 算 
从 笛 卡 儿 积 RXS 中 ,选取 符合 A9B 条 件 的 元 组 , 即 选 取 在 R 关系 中 A 属性 组 上 的 值 与 在 
S 关 系 中 了 属性 组 上 的 值 满足 比较 关系 0 的 元 组 。 
连接 运算 中 有 两 种 最 为 重要 也 最 为 常用 的 连接 。 一 种 是 等 值 连接 (Equijion) , 另 一 种 
是 自然 连接 (Natural join) 。 
9 为 “二 ”的 连接 运算 称 为 等 值 连接 。 等 值 连接 从 笛 卡 儿 积 RXS 中 选取 A 和 B 属 性 值 
相等 的 那些 元 组 , 记 作 : 
RS= {tilt ERAtESAtLA=t[B]) 
自然 连接 是 一 种 特殊 的 等 值 连接 , 它 要 求 A 和 B 必须 是 同名 的 属性 组 ,并 且 在 结果 关 
系 中 要 去 掉 重 复 的 连接 属性 列 。 若 R 和 S 具 有 相同 的 属性 组 B,U 为 R 和 S 的 全 体 属性 集 
合 , 则 自然 连接 可 记 作 : 


RS={tt[U—B]JIt, ERAt. ESAtLB]=t,.[B]} 

一 般 的 连接 运算 是 从 行 的 角度 进行 的 ,而 自然 连接 还 需要 取消 重复 的 属性 列 , 所 以 自然 
连接 同时 从 行 和 列 两 个 角度 进行 运算 。 
【 例 13】 设 学 生 和 选课 关系 中 的 数据 如 下 (只 是 为 了 说 明 问 题 ,减少 之 前 关系 表 中 的 
元 组 数量 ) ,学 生 关系 与 选课 关系 ( 见 表 2-14(a) 、(b)) 之 间 的 笛 卡 儿 积 、 等 值 连接 和 自然 连 


接 的 结果 如 表 2-14(c)、( 


d) Ce) 所 示 。 


表 2-14 关系 间 的 笛 卡 儿 积 、 等 值 连 接 和 自然 连接 运算 的 结果 比较 


(a) 学 生 关系 
Sno Sname Sage Ssex Sdept 
1703070101 李 艺 18 女 信息 学 院 
1703070211 王 一 19 男 信息 学 院 
1703070302 何 穗 18 关 信息 学 院 
(b) 选课 关系 
Sno Cno Grade 
1703070101 03001 76 
1703070101 03002 80 
1703070211 03001 90 
(c) 学 生 X 选 课 
Sno Sname Sage Ssex Sdept SC. Sno Cno Grade 
1703070101 李 艺 18 女 信息 学 院 1703070101 03001 76 
1703070101 李 艺 18 女 信息 学 院 1703070101 03002 80 
1703070101 李 艺 18 女 信息 学 院 1703070211 03001 90 
1703070211 王 一 19 男 信息 学 院 1703070101 03001 76 
1703070211 王 一 19 男 信息 学 院 1703070101 03002 80 
1703070211 王 一 19 男 信息 学 院 1703070211 03001 90 
1703070302 何 穗 18 女 信息 学 院 1703070101 03001 76 
1703070302 何 穗 18 女 信息 学 院 1703070101 03001 80 
1703070302 何 穗 18 女 信息 学 院 1703070211 03001 90 
(d) 学 生 P4 选 课 
学 生 .学 号 = 选课 . 学 号 
Sno Sname Sage Ssex Sdept SC. Sno Cno Grade 
1703070101 李 艺 18 女 信息 学 院 1703070101 03001 76 
1703070101 李 艺 18 女 信息 学 院 1703070101 03002 80 
1703070211 于 一 19 男 信息 学 院 1703070211 03001 90 
(e) 学 生 P4 选 课 
Sno Sname Sage Ssex Sdept Cno Grade 
1703070101 李 艺 18 女 信息 学 院 03001 76 
1703070101 李 艺 18 女 信息 学 院 03002 80 
1703070211 王 一 19 男 信息 学 院 03001 90 
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学 生 关 系 和 选课 关系 在 做 自然 连接 时 ,选择 两 个 关系 在 公共 属性 上 值 相 等 的 元 组 构成 
新 的 关系 。 此 时 ,学 生 关系 中 某 些 元 组 有 可 能 在 选课 关系 中 不 存在 公共 属性 上 值 相 等 的 元 
组 ,从 而 造成 选课 中 这 些 元 组 在 操作 时 被 舍弃 了 .同样 ,学 生 中 某 些 元 组 也 可 能 被 舍弃 。 例 
如 ,在 表 2-14 的 自然 连接 中 学 生 关系 中 的 第 3 个 元 组 被 舍弃 掉 了 。 

如 果 把 舍弃 的 元 组 也 保存 在 结果 关系 中 ,而 在 其 他 属性 上 填空 值 (Null) ,那么 这 种 连接 
就 叫 外 连接 (Outer join)。 如 果 只 把 左边 学 生 关系 中 要 舍弃 的 元 组 保留 就 叫 作 左 外 连接 
(LEFT OUTER JOIN 或 LEFT JOIN) ,如 果 只 把 右边 课程 关系 中 要 舍弃 的 元 组 保留 就 叫 
作 右 外 连接 (RIGHT OUTER JOIN 或 RIGHT JOIN)。 在 表 2-15 中 ,是 对 学 生 关 系 ( 见 
表 2-14(a)) 和 选课 关系 ( 见 表 2-14(b)) 的 外 连接 ,该 表 显 示 的 是 左 外 连接 的 结果 。 


表 2-15 左 外 连接 的 运算 举例 


Sno Sname Sage Ssex Sdept Cno Grade 
1703070101 李 艺 18 女 信息 学 院 03001 76 
1703070101 李 艺 18 女 信息 学 院 03002 80 
1703070211 王 一 19 男 信息 学 院 03001 90 
1703070302 何 穗 18 女 信息 学 院 NULL NULL 

4) 除 运算 


除 运算 (Division) 适 合 于 包含 了 “对 所 有 的 ”此 类 短语 的 查询 。 给 定 关系 R(X,Y) 和 
SCY,Z) ,其 中 X\Y、Z 为 属性 组 。R 中 的 立 与 S 中 的 立 可 以 有 不 同 的 属性 名 ,但 必须 出 自 
相同 的 域 集 。 关 系 R 和 S 的 除法 运算 是 一 个 二 元 运算 , 记 作 : 

RS 

其 结果 是 一 个 新 的 关系 P(X) ,P 中 只 包含 关系 R 的 属性 组 X, 是 关系 R 在 其 属性 组 
上 的 投影 的 元 组 ,该 投影 的 元 组 满足 下 列 条 件 : 该 属性 组 中 的 任何 属性 都 不 包含 在 关系 S 
中 ; 同时 ,元 组 在 X 上 分 量 值 x 的 象 集 Y、 包 含 S 在 Y 上 投影 的 集合 。 记 作 : 

R=S={t[X]|t ERAIy(S)EY,} 
其 中 Y, 为 x 在 R 中 的 象 集 ,x= t:[Xj。 

除 操作 是 同时 从 行 和 列 角度 进行 运算 。 下 面 通过 几 个 例子 进一步 加 深 对 除 操作 的 
理解 。 

【 例 14】 设 关系 R、S 分 别 为 图 2-6 中 的 (a) 和 (b) ,R=S 的 结果 为 表 2-16 。 

在 关系 尺 中 ,A 可 以 取 4 个 值 {al ,az ,as,at}。 其 中 

ai 的 象 集 为 { (bi ,cs), (bz ,ci), (bs ,cs)} 
az 的 象 集 为 { (bs ,c1),(b; ,cs)} 
as 的 象 集 为 {(b ,cs)} 
ai 的 象 集 为 {(bs ,cs )} 
S 在 (B,C) 上 的 投影 为 {(bi ,cs ),(b: ,ci),(b: ,cs)}。 
显然 只 有 a 的 象 集 (B,C) 包 含 了 S 在 (B,C) 属 性 组 上 的 投影 ,所 以 : RS= {al})。 


S 
B D 
| a 
ee 由 
站 人 
me Tac(S) 
lb 
bs 
be a 在 R 中 的 象 集 
在 R 中 的 象 集 
(a) (b) 
图 2-6 除 运算 举例 


表 2-16 ” 除 运 算 举例 结果 


R=S 


A 


al 


【 例 15】 设 表 2-17(a) 为 教师 承担 的 聘 课 情况 表 , 表 2-17(b ) 为 课程 关系 表 , 查 询 承担 
了 所 有 课程 的 教师 号 。 运 算 结 果 如 表 2-17(c) 所 示 。 


表 2-17 
(a) 教师 聘 课 情况 表 T 
教师 号 课程 号 教师 号 课程 号 
1196 03001 0595 03002 
1196 03002 1197 03003 
1196 03003 1197 03002 
1196 03004 1197 03001 
0595 03001 
(b) 课程 关系 表 C 
课程 号 课程 名 学 分 
03001 数据 库 原理 及 应 用 i 
03002 计算 机 网 络 ki 
03003 C 语 言 程序 设计 8 
03004 微机 原理 及 应 用 8 
(c) TFIlmes (C) 
教师 号 
1196 
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5) 关系 代数 应 用 举例 
设 学 生 -选课 关系 数据 库 , 见 表 2-7 一 表 2-9。 注 : 上 述 关 系 中 , 除 年 龄 .学 分 、 成 绩 属性 
的 值 为 整 型 外 ,其 余 均 为 字符 串 型 。 
【 例 16】 求 年 龄 在 20 岁 以 下 的 女 学 生 。 
Ossex = 以 ' ASssge<20 (Student) 
【 例 17】 查询 成 绩 在 90 分 以 上 的 学 生 的 学 号 和 姓名 。 
Tswo, sname (acndc>so (Student D4 SC)) 
【 例 18】 查询 至 少 选 修了 一 门 其 直接 先 修 课 为 '03005' 号 课程 的 学 生 名 。 
Tsname (Gpeno="'03005'( Course [xd SC [xd Student)) 
【 例 19】 求 选修 数据 库 课 程 的 学 生 的 姓名 和 成 绩 。 
JITsname,Grade( [Icno( GCname = 数据 库 (COUTSe) ) [>qd SC [xd Ilsoo, sname (Student)) 
运算 的 表达 式 不 是 唯一 的 。 上 式 也 可 以 用 [Tsowwe,Grade (acname = 数据库 (Course P< SC Pq 
Student) ) 表 示 。 
【 例 20〗 查询 没有 选修 '03005' 号 课程 的 学 生 姓 名 与 年 龄 。 
Isname,ssge (Student) — Ilsname,sage (Gcno='03005'( Student PA SC) 
那么 能 否 用 [Isowme,ssee (ocno# waoos'(Student P< SC) ) 呢 ? 请 读者 自己 思考 。 
【 例 21】 求 选修 全 部 课程 的 学 生 的 姓名 和 学 号 。 
Ilsno,cno (SC) Ilcw (Course) [xl Is。 sname (Student) 
【 例 22】 查询 所 选课 程 包 含 了 学 号 '1703070101' 所 选 全 部 课程 的 学 生 号 和 姓名 。 
JI smame (Student) DA (II cro (SC) I (Gsno='1703070101'( SC))) 


2.5 关系 演算 


用 关系 代数 表示 查询 等 操作 时 , 需 提 供 一 定 的 查询 过 程 描述 ,而 元 组 关系 演算 是 完全 非 
过 程 化 的 , 它 只 需 提 供 所 需 信 息 的 描述 ,而 不 需 给 出 获得 该 信息 的 具体 过 程 。 目 前 ,面向 用 
户 的 关系 数据 语言 基本 上 是 以 关系 演算 为 基础 的 。 

关系 演算 是 以 数理 馆 辑 中 的 谓词 演算 为 基础 的 。 按 谓词 变 元 的 不 同 ,关系 演算 可 分 为 
元 组 关系 演算 和 域 关 系 演算 。 以 谓词 演算 为 基础 的 查询 语言 称 为 关系 演算 语言 。 用 谓词 演 
算 作为 数据 库 查询 语言 的 思想 最 早 见 于 Kuhns 的 论文 。 把 谓词 演算 用 于 关系 数据 库 语 言 
(〈 即 关系 演算 的 概念 ) 是 由 下 . F. Codd 提出 来 的 。 

可 以 证 明 ,关系 代数 、 元 组 关系 演算 和 域 关 系 演算 对 关系 运算 的 表达 能 力 是 等 价 的 , 它 
们 可 以 相互 转换 。 


2.5.1 元 组 关系 演算 
关系 R 可 用 谓词 RO 表示 ,其 中 +t 为 变 元 。 关 系 R 与 谓词 间 的 关系 如 下 : 
R= {tl$(} 
上 式 的 含义 为 : R 是 所 有 使 $(t) 为 真 的 元 组 t 的 集合 。 当 谓词 以 元 组 为 变量 时 , 称 为 
元 组 关系 演算 (Tuple Relational Calculus); 当 谓 词 以 域 为 变量 时 , 称 为 域 关系 演算 


(Domain Relational Calculus) 。 


在 元 组 关系 演算 中 ,把 { tl y(t) } 称 为 一 个 演算 表达 式 , 把 8(t) 称 为 一 个 公式 ,t 为 中 
唯一 的 自由 元 组 变量 。 可 递归 地 定义 元 组 关系 演算 公式 如 下 : 

1. 原子 公式 

(1) 3 类 原子 公式 。 

@ R(tb : R 是 关系 名 ,t 是 元 组 变量 ; R(t) 表 示 t 是 R 中 的 元 组 。 

@ t[i9C 或 Cet[Li]。t[ 详 表示 元 组 变量 的 第 i 个 分 量 ,C 是 常量 ,0 为 算术 比较 运算 符 。 
表示 元 组 t 的 分 量 i 与 常量 C 满足 0 关系 。 

@ t[ibu[ 门 。tu 是 两 个 元 组 变量 。t[z]bu[7 门 表示 元 组 t 的 分 量 i 与 元 组 u 的 分 量 
满足 0 关系 。 

(2) 约束 元 组 变量 和 自由 元 组 变量 。 

设 中 是 元 组 关系 演算 公式 ,t 是 中 的 某 个 元 组 变量 ,那么 (Vt)($)、(t)($) 都 是 元 
组 关系 演算 公式 。 

其 中 : VY 为 全称 量词 ,含义 是 对 所 有 的 …”; 了 为 存在 量词 符号 ,含义 是 “至 少 有 一 个 …”。 
若 在 元 组 关系 演算 公式 中 元 组 变量 前 有 全 称 量词 Y 或 存在 量词 3 ,该 变量 为 约束 元 组 变量 ; 
否则 为 自由 元 组 变量 。 即 受 量词 约束 的 变量 称 为 约束 变量 ,不 受 量词 约束 的 变量 称 为 自由 
变量 。 

(yt)($) 表 示 : 如 果 对 所 有 的 t, 都 是 真 的 , 则 (VD($) 为 真 ,否则 (Vt)($) 为 假 。 

(3t)($) 表 示 : 如 果 对 一 个 + 使 为 真 的 , 则 (了 tb($) 为 真 , 否 则 (了 t)() 为 假 。 

(3) 元 组 关系 演算 公式 的 递归 定义 。 

O@ 每 个 原子 公式 都 是 公式 。 

@ 如 果 $l1、.$2 是 公式 , 则 一 向、$1 人 $2、$1V $2、g$1 一 $2 也 都 是 公式 。 

@ 设 $ 是 公式 ,t 是 由 中 的 某 个 元 组 变量 ,那么 Ytb($) 和 (了 t)($) 也 是 公式 。 

(4) 在 元 组 关系 演算 公式 中 ,运算 符 的 优先 次 序 为 : 括号 一 算术 一 比较 一 存在 量词 ,全 
称 量词 一 迎 辑 非 .与 .或 。 

在 元 组 演算 的 公式 中 ,各 种 运算 符 的 运算 优先 次 序 为 : 

@ 括号 中 的 运算 优先 

@ 算术 比较 运算 符 最 高 ; 

@ 量词 次 之 , 且 按 卫 、V 的 先后 次 序 进行 ; 且 3 的 优先 级 高 于 VY 的 优先 级 ,多 个 相同 量 


词 的 优先 级 由 左 到 右 递增 ; 
@ 刘 辑 运算 符 优 先 级 最 低 , 且 按 ”、A、V 、 一 (蕴含 ) 的 先后 次 序 进行 , 多 个 相同 逻辑 
运算 符 的 优先 级 由 左 到 右 递 增 ; 


(5) 元 组 演算 的 所 有 公式 按 @、O@ .G@ .四 所 确定 的 规则 经 有 限 次 复合 求 得 ,其 他 公式 不 
是 元 组 关系 演算 公式 。 

2. 关系 代数 用 元 组 关系 演算 公式 表示 

为 了 表明 元 组 关系 演算 的 完备 性 ,只 要 说 明 关 系 代数 的 5 种 基本 运算 均 可 等 价 地 用 元 
组 演算 式 表示 (反之 亦 然 ) 即 可 ,所 谓 等 价 是 指 双 方 运算 表达 式 的 结果 关系 相同 。 

设 R、S 为 两 个 关系 ,它们 的 谓词 分 别 为 Rb 、\SCb , 则 : 
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(1) 并 运算 : 即 RUS 可 等 价 地 表示 为 : 
RUS={tIRCOVSCD 
(2) 差 运算 : 即 R 一 S 可 等 价 地 表示 为 : 
R—S={t|R(t) A ”SCD》} 
(3) 笛 卡 儿 积 : 即 RXS 可 等 价 地 表示 为 : 
RXS={t"+®|(Iu®?) (3vm)(RCu AsCv AtL]=u[1] A*t[Ln] 
=uLnj At[nt+1]=v[L1]A* AtLz 十 zz] 一 vLm)])} 
式 中 ,R、S 依次 为 nm 元 关系 ,uv 表示 RS 的 元 组 变量 ,{to+ 几 表示 tt 的 目 数 是 (2 十 2) 。 
(4) 投影 运算 : 即 Has…a(CR) 可 等 价 地 表示 为 : 
Im(R) 一 {t|(3au Ru AtLI]= u[i]A…t[o 王 u[is] 
(5) 选择 运算 : 即 cf(CR) 可 等 价 地 表示 为 : 
oF (R)={t|R(t) AF'} 
其 中 F' 为 F 在 谓词 演算 中 的 表示 形式 , 即 用 t[ 瘦 代替 下 中 + 的 第 i 个 分 量 即 为 F'。 
关系 代数 的 5 种 基本 运算 可 等 价 地 用 元 组 关系 演算 表达 式 表 示 。 因 此 ,元 组 关系 演算 
体系 是 完备 的 ,是 能 够 表示 关系 数据 模型 的 基本 操作 的 。 
可 以 证 明 , 关 系 代数 、 元 组 关系 演算 和 域 关 系 演算 对 关系 运算 的 表达 能 力 是 等 价 的 , 它 
们 可 以 相互 转换 。 
【 例 23】 设 学 生 - 选 课 关 系数 据 库 , 见 表 2-7 一 表 2-9。 
(1) 查询 全 体 男 学 生 的 情况 。 
R1={tlStudent(t) 入 t[4]==' 男 '} 
(2) 查询 学 号 为 "1703070101? 的 学 生 选 修 课 程 中 成 绩 为 90 分 以 上 的 所 有 课程 号 。 
R2={t2|1(3u1ScCu AtCI]=u[2]Au[1]=“1703070101”Au[3] 之 90} 
(3) 查询 选修 课程 号 为 “03001” 的 所 有 学 生 的 学 号 和 姓名 。 
R3={t?|(IwW( Iv)|Student(u) ASCCv) At[1]=u[Ll] A tL2] 
=u[2] Au[1]=v[1] Av[L2]=“03001”} 
元 组 关系 演算 是 一 种 抽象 的 语言 。 一 种 典型 的 具体 元 组 关系 演算 语言 是 E. F. Codd 提 
出 的 AILPHA 语言 。 关 系数 据 库 管理 系统 Ingres 所 用 的 QUEL 语言 是 参照 ALPHA 语 
言 研 制 的 ,与 ALPHA 十 分 类 似 。 


2.5.2 域 关 系 演算 


域 关 系 演算 类 似 于 元 组 演算 ,只 是 域 关系 演算 以 元 组 变量 的 分 量 ( 即 域 变量 ) 作 为 谓 间 
变 元 的 基本 对 象 。 在 关系 数据 库 中 ,关系 的 属性 名 可 以 视 为 域 变量 。 域 演算 表达 式 的 一 般 
形式 为 : 

{ti ttk| 和 (bytzytk)》 

其 中 心 ,t,…'tk 分 别 为 元 组 变量 t 的 各 个 分 量 ,统称 域 变 量 ,$ 为 域 演算 公式 。 域 演算 公式 
由 原子 公式 和 运算 符 组 成 。 

1 原子 公式 

(1) 3 类 原子 公式 。 

@ Rbybe,…'tk): 及 是 kk 元 关系 ,t 是 域 变 量 或 常量 ,R (t,ts,…,txk) 表 示 由 分 量 


R(t ,ts，*… ,tx) 组 成 的 元 组 属于 关系 R。 

@ togu: tu 为 域 变量 ,0 为 算术 比较 符 ,tgu 表示 tu 满足 比较 条 件 0。 

@ t9C 或 Cgtb: t\t 是 域 变量 ,C 为 常量 ,公式 表示 t; 和 C 满足 比较 条 件 0。 

(2) 约束 域 变 量 和 自由 域 变量 。 

若 在 域 关 系 演算 公式 中 域 变 量 前 有 全 称 量词 Y 或 存在 量词 3 ,该 变量 为 约束 变量 ,否则 
为 自由 域 变量 。 

2. 域 关系 演算 公式 的 递归 定义 

(1) 每 个 原子 公式 都 是 公式 。 

(2) 如 果 和 和 92 是 域 关 系 演算 公式 , 则 各 入 各 ,条 V 和 2, 抽 一 和 也 是 域 关 系 演算 公 3 

(3) 如 果 $ 是 域 关系 演算 公式 , 则 Vt($) 和 ti($) (i 二 1,2,3,…,k) 也 是 域 关系 演算 
公式 。 

(4) 域 关系 演算 公式 的 运算 符 的 优先 次 序 为 括号 一 算术 一 比较 一 存在 量词 ,全称 量 
词 一 多 辑 非 . 与 .或 ,与 元 组 关系 演算 公式 中 运算 符 优 先 级 的 规定 相同 。 

(5) 域 关系 演算 公式 是 有 限 次 应 用 上 述 规 则 的 公式 ,其 他 公式 不 是 域 关 系 演算 公式 。 

【 例 24】 对 于 例 23 中 的 元 组 关系 演算 示例 ,用 域 演算 可 表示 为 : 

(1) 查询 全 体 男 学 生 的 情况 。 

R={titststits | (student(titstststs ) At4=' 男 '))} 
(2) 查询 学 号 为 *1703070101” 的 学 生 选 修 课程 中 成 绩 为 90 分 以 上 的 所 有 课程 号 。 
R={ts| (3t) (3ta) (SC (butts) 人 Ah 一 '1703070101' 人 At 之 90)》 
(3) 查询 选修 课程 号 为 "03001? 的 所 有 学 生 的 学 号 和 姓名 。 
R={tittl(3t)(3at)(3at) (au) (3au) (Ius) (student(ttststts ) A 
SC (uusus) Mt =u Au,='03001')} 

关于 关系 的 各 类 运算 的 安全 限制 及 等 价 问题 如 下 。 

(1) 在 关系 代数 中 ,不 用 求 补 运算 而 采用 求 差 运算 ,其 原因 就 是 有 限 集合 的 补 集 可 能 是 
无 限 集 。 关 系 是 笛 卡 儿 积 的 有 限 子 集 ,其 任何 运算 结果 也 为 关系 ,因而 关系 代数 是 安全 的 。 

(2) 在 关系 演算 中 ,表达 式 {t| R(t)) 等 可 能 表示 无 限 关系 。 

(3) 在 关系 演算 中 ,判断 一 个 命题 正确 与 否 . 有 时 会 出 现 无 穷 验证 的 情况 。 如 判定 命题 
(了 uCW(u) ) 为 假 时 ,必须 对 变量 u 的 所 有 可 能 值 都 进行 验证 , 当 没有 一 个 值 能 使 WCu) 取 
真 值 时 ,才能 作出 结论 , 当 u 的 值 可 能 有 无 限 多 个 时 ,验证 过 程 就 是 无 穷 的 。 又 如 判定 命题 
(Yu(CW(u) ) 为 真 也 如 此 ,会 产生 无 穷 验证 。 

若 对 关系 演算 表达 式 规定 某 些 限 制 条 件 , 对 表达 式 中 的 变量 取 值 规定 一 个 范围 ,使 之 不 
产生 无 限 关 系 和 无 穷 运算 的 方法 , 称 为 关系 运算 的 安全 限制 。 施 加 了 安全 限制 的 关系 演算 
称 为 安全 的 关系 演算 。 

关系 代数 和 关系 演算 所 依据 的 基础 理论 是 相同 的 ,因此 可 以 进行 相互 转换 。 人 们 已 经 
证 明 ,关系 代 数 、 安 全 的 元 组 关系 演算 .安全 的 域 关 系 演算 在 关系 的 表达 能 力 上 是 等 价 的 。 


2.6 关系 数据 库 产品 


从 1970 年 Codd 发 表 论 文 提出 关系 模型 算 起 ,关系 数据 库 产品 已 经 历 了 将 近 50 年 的 


第 
2 
发 展 ,无 论 是 在 理论 上 还 是 在 实践 上 都 形成 了 相对 完整 的 体系 。 目 前 ,关系 数据 库 产品 在 数 | 章 
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据 管理 市 场 中 占有 绝对 优势 地 位 。2006 年 ,来 自 国际 市 场 调查 公司 IDC 的 数据 表明 ,关系 
数据 库 市 场 中 Oracle、IBM DB2、Microsoft SQL Server 和 Sybase 的 占有 率 分 别 为 53. 5%、 
21.2%、18.6% 和 3.2% ,剩余 3.5% 的 份额 被 其 他 关系 数据 库 产品 所 占有 ,其 中 包括 两 个 知 
名 的 开源 关系 数据 库 产品 PostgreSQL 和 MySQL。 图 2-7 给 出 了 主要 关系 数据 库 产品 的 
发 展 时 间 线 及 其 渊源 关系 ( 实 线 箭头 表示 直接 发 展 ,虚线 箭头 表示 间接 影响 ) 。 
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图 2-7 关系 数据 库 产品 的 发 展 


1970 年 IBM 研究 员 Codd 博士 发 表 论 文 提出 了 关系 数据 库 的 基本 理论 ,随后 IBM 公 
司 成 立 研 究 小 组 研制 名 为 System R 的 关系 数据 库 实 验 室 原型 产品 。 几 乎 在 同一 时 期 ,加 
州 大 学 Berkeley 分 校 的 一 个 研究 团队 以 Codd 论文 和 System R 发 表 的 研究 报告 为 基础 , 独 
立 研制 出 关系 数据 库 原型 系统 Ingres。 无 论 是 System R 还 是 Ingres, 当 时 它们 的 开发 目的 
主要 是 为 了 学 术 研 究 而 非 商品 化 发 布 。 

就 在 这 个 时 期 ,L. Ellison 领导 的 Oracle 开发 团队 抓 住 了 时 机 ,在 Codd 论文 和 System 
R 公开 发 表 文献 的 基础 上 ,于 1979 年 研制 成 功 并 发 布 了 第 一 个 商业 关系 数据 库 产品 Oracle 
V2。 此 后 Oracle 逐渐 成 为 市 场 占有 率 最 高 的 RDBMS 产品 。1980 年 ,IBM 开始 意识 到 来 
自 Oracle 的 竞争 压力 , 转 而 重视 关系 数据 库 的 商品 化 ,1983 年 IBM 以 System R 的 研制 经 
验 为 指导 ,重新 开发 了 关系 数据 库 产品 DB2 。 

同时 ,曾经 是 lngres 团队 核心 成 员 的 一 些 学 生 , 在 毕业 后 成 立 了 Sybase 公司 ,他们 于 
1984 年 推出 的 关系 数据 库 产品 Sybase 继承 了 Ingres 的 核心 代码 。 在 1990 年 初 ,微软 公司 
通过 合作 形式 将 Sybase 数据 库 移 植 到 Windows 操作 系统 上 ,并 命名 为 SQL Server。1995 
年 微软 与 Sybase 的 合作 终止 ,从 那 时 起 ,微软 开始 独立 开发 SQL Server。 

Ingres 的 另 一 个 发 展 路 径 是 在 开源 社区 由 Posgres 演变 为 PosgresSQL。1995 年 出 现 
的 MySql 也 是 一 个 知名 的 开源 关系 数据 库 产品 。 


下 面 分 别 介 绍 商业 关系 数据 库 产 品 Oracle、IBM DB2、Microsoft SQL Server 和 
Sybase, 以 及 开源 关系 数据 库 产品 PosgresSQL 和 MySQL。 

1. Oracle 

Oracle 数据 库 是 甲骨 文 (Oracle) 公 司 开 发 的 关系 数据 库 管理 系统 ,多 年 来 它 一 直 处 于 
关系 数据 库 市 场 的 领先 地 位 。 目 前 Oracle 数据 库 的 最 新 版 本 是 2009 年 9 月 发 布 的 Oracle 
llg 第 2 版 ,其 中 g 代表 grid, 即 表示 其 支持 网 格 计算 。Oracle 数据 库存 储 数据 的 逻辑 结构 
包括 表 空间 (tablcepace)、 表 ,数据 段 、 区 和 数据 块 等 ,存储 数据 的 物理 结构 包括 数据 文件 \ 日 
志文 件 ,参数 文件 和 控制 文件 等 。Oracle 数据 库 具 有 完善 的 内 存 管理 、 多 进程 管理 、 多 用 户 
并 发 控制 及 参数 配置 机 制 。 

Oracle 数据 库 的 发 行 版 本 包括 企业 版 .标准 版 .标准 版 1 和 简化 版 等 。Oracle 产品 支持 
Windows、 Linux、Mac OS、HP-UX、AIX、Solaris 等 多 种 操作 系统 以 及 x86、x86-64、 
Itanium、PowerPC、Alpha 等 多 种 硬件 架构 。 

2. IBM DB2 

IBM 公司 研制 的 关系 数据 管理 系统 DB2 主要 应 用 于 大 型 信息 系统 ,多 年 来 DB2 一 直 
被 IBM 大 型 机 所 专用 ,具有 较 好 的 可 伸缩 性 。 后 来 ,IBM 将 DB2 引入 其 他 平台 ,包括 0S/2、 
UNIX、Windows 和 Linux 等 。 目 前 DB2 的 最 新 版 本 是 2013 年 6 月 发 布 的 DB2 V10.5, 它 
的 代码 名 是 “Viper 2”,IBM 宣传 该 版 本 的 最 大 特点 是 实现 了 关系 数据 库 与 XML 数据 的 无 
颖 交互 。DB2 的 免费 版 本 DB2 Express-C 并 不 限制 用 户 数量 以 及 数据 库 的 大 小 ,可 以 在 任 
何 Windows 和 Linux 机 器 上 运行 ,只 是 数据 库 引擎 最 多 只 能 使 用 2 个 CPU 内 核 和 2GB 
内 存 。 

自 20 世纪 80 年 代 中 期 开始 ,数据 库 管 理 软件 市 场 就 被 Oracle 所 占据 。2004 年 5 月 3 
日 ,IBM 数据 库 开 发 和 销售 的 高 层 人 员 Janet Perna 宣布 他 们 的 主要 竞争 对 手 在 高 级 事务 
处 理 方面 为 Oracle, 在 决策 支持 系统 方面 为 Teradata。 当 然 ,在 中 小 规模 数据 管理 市 场 中 
DB2 也 有 其 他 的 竞争 者 ,包括 Microsoft SQL Server 以 及 开源 产品 PostgreSQL 和 
MySqL 等 。 

3. Microsoft SQL Server 

Microsoft SQL Server 是 由 微软 公司 推出 的 关系 数据 库 管理 产品 。Microsoft SQL 
Server 前 期 的 几 个 版 本 主要 适用 于 中 小 企业 的 数据 库 管 理 ,但 是 近年 来 它 的 应 用 范围 有 所 
扩展 ,已 经 触及 大 型 跨国 企业 的 数据 库 管理 。 

SQL Server 一 开始 并 不 是 微软 自己 研发 的 产品 ,而 是 当时 为 了 要 和 IBM 竞争 ,与 
Sybase 合作 研发 的 ,其 最 早 的 开发 者 是 Sybase 公司 。 同 时 微软 也 和 Sybase 合作 过 SQL 
Server 4. 2 版 本 的 研发 ,微软 也 将 SQL Server 4. 2 移植 到 了 Windows NT( 当 时 为 3.1 版 )。 
在 与 Sybase 终止 合作 关系 后 ,独立 开发 出 SQL Server 6.0 版 ,此 后 的 SQL Server 均 由 微 
软 自行 研发 。 

SQL Server 2000 可 以 说 是 微软 数据 库 服务 器 中 “生命 期 最 久 ”( 自 2000 年 8 月 9 日 发 
布 开 始 到 2005 年 11 月 SQL Server 2005 上 市 为 止 ,长 达 五 年 零 三 个 月 ), 而 且 后 续 添加 的 
新 功能 也 是 最 多 的 版 本 。 与 SQL Server 2000 相 比 ,SQL Server 2005 有 了 很 大 的 改变 , 主 
要 包括 : 以 SQL Server Management Studio 作为 数据 库 集成 管理 工具 取代 原来 的 “企业 管 
理 器 ”; 强化 XML 的 处 理 能 力 , 新 增 了 XML 数据 类 型 ,支持 XML 查询 数据 库 引擎 的 安全 
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性 功能 得 到 强化 。SQL Server 2008 是 SQL Server 2005 的 功能 增强 版 本 ,SQL Server 2016 
是 最 新 版 本 。 

4. Sybase 

Sybase 公司 于 1987 年 推出 了 Sybase 数据 库 的 第 一 个 版 本 ,最初 的 产品 名 称 是 Sybase 
SQL Server。1988 年 至 1993 年 间 ,Sybase 与 微软 合作 开发 了 OS/2 和 Windows NT 平台 
下 的 Sybase 数据 库 。 此 后 ,两 家 公司 分 道 扬 镀 ,各 自 开 发 独立 的 版 本 。 为 了 区 别 于 
Microsoft SQL Server, 1996 年 Sybase 公司 将 其 数据 库 产 品 更 名 为 Adaptive Server 
Enterprise, 简 称 ASE。 目 前 ASE 16 是 Sybase 数据 库 的 最 新 版 本 。 与 Microsoft SQL 
Server 不 同 ,ASE 同时 提供 在 多 种 UNIX、Linux 和 Windows 操作 系统 下 运行 的 版 本 。 

5. PostgreSQL 

PostgreSQL, 是 一 个 开放 源 代码 的 、 功 能 完整 的 关系 数据 库 管理 系统 ,其 开发 基础 是 加 
州 大 学 伯克利 分 校 的 研究 项 目 Postgres ,许多 商业 数据 库 中 后 来 才 出 现 的 特性 最 初 均 来 自 
Postgres。 

1994 年 ,伯克利 大 学 的 两 个 研究 生 Andrew Yu 和 Jolly Chen 为 Postgres 编写 了 新 的 
SQL 查询 语言 解释 器 来 取代 原 有 的 QUEL 查询 语言 ,创建 了 Postgres95, 并 将 源 代 码 发 布 
到 互联 网 上 。1996 年 ,Postgres95 被 更 名 为 PostgresSQL ,以 表明 其 支持 新 的 SQL 查询 语 
言 。 此 后 ,来 自 世 界 各 地 的 一 些 数 据 库 开发 者 和 志愿 者 ,通过 Internet 进行 协作 ,共同 维护 
PostgreSQL 的 开发 ,目前 的 最 新 版 本 是 2016 年 4 月 发 布 的 PostgresqL 9. 4.4。 

6. MySQL 

MySQL 也 是 一 种 开放 源 代码 的 关系 数据 库 管理 系统 ,其 开发 者 为 瑞典 MySQL AB 公 
司 。2008 年 1 月 Sun 公司 收购 了 MySQL ,而 2009 年 4 月 Sun 公司 又 被 Oracle 公司 收购 ， 
目前 MySQL 被 广泛 地 应 用 在 Internet 上 的 中 小 型 网 站 中 ,由 于 其 体积 小 .速度 快 、 成 本 低 ， 
尤其 是 开放 源码 这 一 特点 ,许多 中 小 型 网 站 为 了 降低 总 体 成 本 而 选择 MySQL 作为 后 台数 
据 库 。MySQL 的 最 新 版 本 是 2016 年 发 布 的 MySQL 5.7.17。 

与 其 他 大 型 数据 库 相 比 ,MySQL 有 它 的 不 足 之 处 ,如 规模 小 、 功 能 有 限 等 ,但 是 这 并 没 
有 减少 它 的 受 欢 迎 程度 。 对 于 一 般 的 个 人 用 户 和 中 小 型 企业 来 说 ,MySQL 提供 的 功能 已 
经 绰绰有余 ,而 且 由 于 MySQL 是 开放 源码 软件 ,因此 可 以 大 大 降低 总 体 成 本 。 


2.7 小 结 


关系 数据 库 是 目前 应 用 最 为 广泛 的 数据 管理 工具 。 建 立 在 关系 模型 基础 上 的 关系 数据 
库 系统 是 本 书 的 重点 ,这 是 因为 20 世纪 70 年 代 以 后 开发 的 数据 库 管理 系统 产品 几乎 都 是 
基于 关系 的 。 关 系 模型 及 关系 数据 库 管理 系统 是 数据 库 发 展 史 上 最 为 重要 的 成 就 之 一 。 

关系 数据 库 系 统 与 非 关 系数 据 库 系统 的 区 别 是 ,关系 系统 只 有 “ 表 ” 这 一 种 数据 结构 ; 
而 非 关系 数据 库 系 统 还 有 其 他 数据 结构 ,以 及 对 这 些 数据 结构 的 操作 。 在 用 户 看 来 ,关系 数 
据 结 构 就 是 一 张 二 维 表 。 

本 章 讨论 了 关系 模型 的 3 个 组 成 部 分 , 即 关系 数据 结构 ,关系 完整 性 约束 和 关系 操作 。 

关系 模型 定义 了 3 类 完整 性 约束 实体 完整 性 ,参照 完整 性 和 用 户 定义 完整 性 。 

关系 代数 是 定义 关系 模型 中 数据 操作 的 代数 结构 来 表达 的 关系 语言 。 关 系 代数 的 运算 


符 作用 在 一 个 或 多 个 关系 上 ,产生 的 运算 结果 也 是 关系 ,可 将 关系 代数 看 作 一 种 形式 化 的 关 
系 模 型 查询 语言 。 本 章 最 后 介绍 了 常用 的 关系 数据 库 产品 。 


习 题 


1. 论述 关系 模型 的 3 个 组 成 部 分 。 

2. 解释 关系 数据 结构 中 的 下 列 术语 : 

域 、 笛 卡 儿 积 关系 、 候 选 码 、 主 码 、 主 属性 、 非 主 属性 、 关 系 模式 

3. 什么 是 实体 完整 性 ? 什么 是 参照 完整 性 ? 两 者 有 何 联系 ? 

4. 列举 常用 的 关系 数据 库 产品 。 

5. 设 “项 目 -员工 ”数据 库 包 括 如 下 关系 模式 

E(Empno, Empname, Esex, Epos) 

P(Pno, Pname, Pdes, Period) 

PE(Pno, Empno, Hpw) 

员工 关系 下 由 编号 (Empno)、 姓 名 (Empname)、 性 别 (Esex) 和 职务 (Epos) 属 性 
组 成 。 

项 目 关系 P 由 编号 (Pno)、 名 称 (Pname) 、 描 述 (Pdes) 和 工期 (Period) 属 性 组 成 。 
参与 关系 PE 由 项 目 编 号 (Pno)、 员 工 编号 (Empno) 和 周 工作 时 间 (Hpw) 属 性 组 成 。 
周 工作 时 间 是 指 某 员工 在 某 项 目 上 工作 一 周 所 花费 的 小 时 数 。 若 上 述 关系 模式 的 


实例 关系 数据 如 下 : 
员工 关系 下 
Empno Empname ESex EPos 
El 张 奕 男 项 目 经 理 
E2 李 思 要 程序 员 
E3 王 武 男 项 目 经 理 
E4 赵 柳 女 程序 员 
项 目 关 系 
Pno Pname Pdes 了 Period 
二 和 项 目 1 9 12 
P2 项 目 2 权 24 
参与 关系 PE 
Pno Empno Hpw 
Pl El 40 
i E3 20 
了 下 4 20 
P2 E2 40 
P2 E3 20 
P2 E4 20 
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请 使 用 关系 代数 完成 如 下 查询 : 

(1) 查询 全 体 员工 的 姓名 和 性别 。 

(2) 查询 员工 * 张 奕 ” 的 职务 。 

(3) 查询 工期 大 于 18 的 项 目 编号 和 名 称 。 

(4) 查询 参与 了 项 目 Pl 的 员工 编号 。 

(5) 查询 参与 了 全 部 项 目的 员工 编号 和 姓名 。 

(6) 查询 每 个 员工 的 编号 、 姓 名 性别、 所 参与 项 目的 编号 ,名称 及 周 工作 时 间 。 
(7) 查询 所 参与 项 目 包含 工期 为 24 的 全 部 项 目的 员工 姓名 和 职务 。 

(8) 查询 员工 “ 李 思 ”不 参与 的 项 目的 编号 、 名 称 和 工期 。 


第 3 章 关系 数据 库 标准 语言 SQL 


【本 章 主要 内 容 】 

1. 简要 介绍 SQL 语言 的 发 展 历史 以 及 SQL 语言 的 特点 

2. 重点 冰 述 数据 定义 语言 , 即 对 模式 、 表 、 视 图 及 索引 的 定义 与 删除 
3. 着重 介绍 数据 查询 方法 ( 单 表 、 多 表 、 谋 套 查 询 ) 及 数据 的 更 新 方法 
4. 简介 视图 的 查询 和 更 新 方法 


通过 之 前 对 关系 数据 模型 和 关系 语言 的 介绍 ,我 们 了 解 到 在 关系 模型 的 发 展 过 程 中 出 
现 了 一 种 称 为 结构 化 的 查询 语言 ,通常 称 为 SQL。 现 在 ,SQL 已 成 为 标准 的 关系 数据 库 语 
言 , 它 不 仅 用 于 查询 和 更 新 关系 数据 库 中 的 数据 ,而 且 管 理 关系 数据 库 中 的 元 数据 和 各 种 数 
据 库 对 象 ,是 用 户 和 数据 库 管理 员 建 立 、 使 用 数据 库 的 主要 工具 。SQL 虽然 称 为 “结构 化 查 
询 语 言 ”, 但 其 功能 不 仅仅 局 限于 数据 查询 , 它 还 具有 数据 定义 和 更 新 的 功能 。 对 于 关系 数 
据 库 来 说 ,SQL 是 介 于 关系 代数 与 关系 演算 之 间 的 结构 化 查询 语言 , 它 是 通用 的 、 功 能 极 强 
的 且 具 有 国际 标准 的 关系 数据 库 语 言 , 早 已 成 为 一 种 通用 的 、 功 能 强大 的 数据 管理 语言 。 几 
乎 所 有 的 主流 关系 数据 库 产 品 都 支持 SQL 语言 ,此 外 许多 厂商 还 在 标准 SQL 的 基础 上 进 
行 了 不 同 程度 的 扩展 。 

本 章 首先 对 SQL 进行 简单 的 概述 ,包括 SQL 产生 与 发 展 .SQL 的 功能 和 特点 ,然后 详 
细 讲 解 SQL 的 常用 语句 的 形式 , 即 如 何 使 用 SQL 进行 数据 定义 、 如 何 进行 多 种 风格 的 查询 
及 数据 更 新 , 接 下 来 讨论 视图 的 定义 及 其 特点 ,最 后 简单 介绍 查询 优化 的 相关 问题 。 


3.1 SQL 概述 


SQL 是 Structured Query Language 的 缩写 , 即 结构 化 查询 语言 。SQL 是 一 种 声明 式 
(Declarative) 语 言 。 它 不 同 于 传统 的 命令 式 (Imperative) 编 程 语言 ,使 用 SQL 只 需要 描述 
“做 什么 ”, 而 无 须 具体 指明 “怎么 做 ”。 


3.1.1 SQL 的 产生 与 发 展 


关系 模型 起 源 于 在 IBM San Jose 研究 室 工作 的 E. F. Codd 于 1970 发 表 的 一 篇 论文 (A 
Relational Model of Data for Large Shared Data Banks)。 为 了 将 这 篇 论文 中 提出 的 关 
系数 据 库 模 型 变 为 现实 ,该 实验 室 的 一 个 团队 一 直 致 力 于 关系 数据 库 管 理 系 统 的 研发 工作 。 
1974 年 ,该 研究 室 的 D. Chamberlin 和 Boyce 定义 了 一 种 称 为 SEQUEL (Structured 
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English Query Language) 的 结构 化 查询 语言 。1976 年 ,其 修改 版 本 SEQUEL/2 出 现 , 然 后 
正式 改名 为 SQL。 如 今 , 仍 有 很 多 人 将 SQL 读 为 “See-Quel” ,尽管 官方 的 读 法 为 “S-Q-L”。 

IBM 在 SEQUEL/2 的 基础 上 推出 了 称 为 System R 的 DBMS 原型 ,用 于 验证 关系 模型 
的 可 行 性 。 除 了 其 他 方面 的 成 果 外 ,System R 最 重要 的 成 果 是 开发 了 SQL。 但 是 SQL 的 
最 初 起 源 应 当 追 溯 到 System R 前 期 的 SQUARE (Specifying Queries As Relational 
Expression) 语 言 , 它 是 一 种 用 英语 句子 表示 关系 代数 的 研究 性 语言 。 

20 世纪 70 年 代 末 期 ,Relational Software( 现 称 为 Oracle Corporation) 的 公司 推出 了 第 
一 个 基于 SQL 语言 开发 的 商品 化 RDBMS-Oracle 数据 库 系统 ,并 将 这 些 产 品 内 部 版 本 销售 
给 美国 的 一 些 政府 部 门 。 不 久 , 又 出 现 了 基于 QUEL 查询 语言 的 INGRES 数据 库 系统 ， 
QUEL 语言 和 SQL 语言 相 比 ,结构 化 特性 更 强 ,但 与 英语 语句 不 大 类 似 。 当 SQL 成 为 关系 
数据 库 系 统 标准 语言 后 ,INGRES 也 转向 支持 SQL 。 

1979 年 夏天 ,Relational Software 公司 发 布 了 第 一 个 商业 SQL 实现 产品 Oracle V2。 
正 是 由 于 Relational Software 公司 对 关系 模型 和 SQL 的 前 瞻 性 把 握 ,使 得 此 后 Oracle 产品 
的 市 场 占有 率 一 直 高 于 IBM 的 关系 数据 库 产 品 。 

1981 年 和 1982 年 ,IBM 公司 分 别 在 DOS/VSE 和 VM/CMS 环境 下 推出 了 第 一 个 商 
品 化 RDBMS-SQLVDS 数据 库 系统 。 随 后 又 于 1983 年 在 MVS 环境 下 推出 DB2 数据 库 

1982 年 ,美国 国家 标准 组 织 基于 IBM 公司 提交 的 一 份 概念 性 建议 文件 开始 着 手 制定 
关系 数据 库 语 言 (RDL) 的 标准 。1983 年 国际 标准 化 组 织 (ISO) 参 与 这 一 工作 ,并 共同 制定 
了 SQL 标准 。1986 年 10 月 ,美国 国家 标准 学 会 (LANSI) 批 准 了 SQL 作为 关系 数据 库 的 标 
准 语言 ,并 于 同年 公布 了 SQL 标准 文本 ,简称 SQL-86 。 

1987 年 ISO 将 SQL-86 作为 国际 标准 。ANSI 于 1989 年 10 月 公布 了 名 为 “完整 性 增 
强 特 性 ”(Integrity Enhancement Feature) 的 补充 文件 (ISO,1989) ,推出 了 SQL-89 标准 ， 
SQL-89 在 SQL-86 的 基础 上 进行 了 小 规模 的 完善 工作 。 由 于 SQL 直接 关系 到 重要 数据 的 
处 理 , 美 国联 邦 政府 也 将 SQL-89 采纳 为 官方 文件 , 称 为 FIPS 127-1。 

1992 年 ,ISO 对 SQL 进行 了 较 大 规模 的 修改 和 扩展 ,于 1992 年 8 月 发 布 了 国际 标准 
ISO/IEC: 9075 ,简称 SQL-92 或 SQL2, 人 们 习惯 上 将 这 个 标准 称 为 SQL2。SQL-92 的 标 
准 文本 有 600 多 页 。 

此 后 ,SQL 的 标准 化 工作 一 直 在 继续 。 经 过 7 年 的 修订 和 补充 ,1999 年 ISO 发 布 了 
SQL: 1999(ISO,1999a) 标 准 ,这 个 版 本 附加 了 包括 支持 面向 对 象 数据 管理 等 特性 ,这 个 标 
准 文 本 厚 达 1700 多 页 ,人 们 习惯 上 将 这 个 标准 称 为 SQL3。 

2003 年 .2006 年 及 2011 年 末 ISO 又 分 别 发 布 了 SQL2003、SQL2006 及 ISO2011, 这 是 
三 个 修订 的 版 本 。 标 准 在 SQL: 1999 的 基础 上 扩展 了 若干 高 级 特性 ,其 中 最 重要 的 是 在 
SQL 中 嵌入 了 对 XML 数据 管理 的 支持 。 

虽然 SQL 源 于 IBM 公司 的 建议 .但 是 很 快 就 使 其 他 供应 商 意识 到 其 重要 性 而 纷纷 推 
出 自己 的 产品 。 时 至 今日 , 数 百 个 基于 SQL 的 产品 正在 应 用 ,而 且 新 产品 还 在 不 断 涌现 。 
表 3-1 总 结 了 SQL 语言 的 标准 化 进程 。 


表 3-1 SQL 语言 的 标准 化 进程 


年 份 名 称 别 名 描 述 

1986 SQL-86 SQL-87 ANSI 首次 发 布 的 SQL 标准 。1987 年 被 ISO 批准 为 国际 标准 
1989 ”SQL-89 FIPS127-1 ”小 规模 修订 ,被 美国 联邦 政府 采纳 为 FIPS 127-1 

1992 ”SQL-92 SQL2 大 规模 修订 ,形成 国际 标准 ISO/IEC 9075 

1999 SQL-1999 SQL3 添加 了 正则 表达 式 匹 配 . 触 发 器 ,控制 流程 语句 、 面 向 对 象 特性 等 
2003 SQL-2003 引入 了 XML 相关 特性 、 窗 口 函 数 、 自 动 生成 列 (包括 表示 列 ) 等 
2006 SQL-2006 进一步 增强 了 SQL 中 的 XML 功能 支持 


3.1.2 SQL 的 功能 将 点 


SQL 之 所 以 能 够 成 为 关系 数据 库 的 标准 语言 ,并 以 统一 的 方式 管理 和 操作 关系 数据 ， 
得 益 于 其 所 具备 的 几 个 显著 特点 , 即 它 是 一 个 综合 的 、 通 用 的 、 功 能 极 强 ,又 简单 易学 的 语 
言 。 它 集 数据 查询 ,数据 操纵 ,数据 定义 和 数据 控制 为 一 体 ,这 些 特点 使 SQL 在 众多 数据 管 
理 语言 中 脱颖而出 ,发 展 为 最 流行 的 ,用 户 最 多 的 关系 数据 库 语言 。 其 主要 特点 包括 。 

1. 综合 统一 

数据 库 系 统 的 主要 功能 是 通过 数据 库 支持 的 数据 语言 来 实现 的 。 

非 关系 模型 的 数据 语言 一 般 分 为 模式 数据 定义 语言 .外 模式 数据 定义 语言 .数据 存储 有 
关 的 描述 语言 及 数据 操纵 语言 。 使 用 数据 语言 分 别 用 于 定义 模式 、 外 模式 、 内 模式 和 进行 数 
据 的 查询 与 更 新 等 操作 。 当 用 户 数 据 库 投入 运行 后 ,如 果 需 要 修改 描述 ,必须 停止 现 有 数据 
库 的 运行 , 转 储 数据 ,修改 描述 并 编译 后 再 重新 装载 数据 库 ,非常 麻烦 。 

SQL 虽然 称 为 “结构 化 查询 语言 ", 但 SQL 的 功能 不 仅仅 包括 查询 ,实际 上 SQL 作为 
一 种 标准 数据 库 语 言 , 从 对 数据 库 的 各 种 操作 到 数据 库 的 管理 维护 ,几乎 无 所 不 能 。SQL 
集 数据 定义 ,数据 操 纵 .数据 控制 语言 的 功能 于 一 体 , 其 功能 全 面 ,语法 风格 统一 。 可 以 独立 
完成 数据 库 生 命 周 期 中 的 全 部 活动 ,包括 定义 关系 模式 、 建 立 数据 库 ,实现 查询 .更 新 .维护 、 
数据 库 重 构 ,安全 性 控制 等 一 系列 操作 ,为 使 用 数据 库 系 统 提 供 了 良好 的 语言 环境 。 

2. 高 度 非 过 程 化 

非 关 系数 据 模型 的 数据 操纵 语言 是 面向 过 程 的 语言 , 当 要 完成 某 项 请 求 时 , 需 指 定 存 取 
路 径 ,并且 以 "一 次 一 记录 ?的 方式 操作 。 而 SQL 语言 则 是 非 过 程 化 的 、 集 合式 的 数据 操作 ， 
用 户 只 需 提出 “做 什么 ”, 而 无 须 具 体 指出 怎么 完成 这 件 事情 的 详细 步 又。 执行 SQL 语句 的 
详细 步骤 ( 存 取 路 径 的 选择 以 及 SQL 语句 的 操作 过 程 ) 交 由 DBMS 内 部 自动 完成 。 因 此 用 
户 无 须 了 解 存 取 路 径 , 这 样 不 仅 大 大 减轻 了 用 户 负担 ,又 有 利于 提高 数据 独立 性 。 

3. 灵活 的 使 用 方式 

SQL 既 可 以 用 作 交 互 式 语言 ,又 可 以 用 作 和 嵌入 式 语 言 。 作 为 交互 式 语言 ,用 户 可 以 在 
DBMS 客户 端 直接 输入 SQL 命令 ,查看 执行 结果 。 作 为 嵌入 式 语 言 ,SQL 可 以 通过 各 种 方 
式 幅 入 到 主流 编程 语言 中 , 供 程序 开发 人 员 使 用 。 如 C 语言 可 以 使 用 嵌入 式 SQL 或 
ODBC,Java 使 用 JDBC,C# 使 用 ADO. NET 等 。 这 些 技术 的 目的 都 是 让 SQL 嵌入 到 编程 
语言 中 ,使 应 用 程序 与 数据 库 之 间 实 现 连 接 和 沟通 ,不 同 的 使 用 方式 ,统一 的 语法 格式 , 供 开 
发 复杂 应 用 程序 使 用 ,这 体现 了 SQL 的 方便 性 与 灵活 性 。 
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4. 面向 集合 

关系 实际 上 就 是 元 组 的 集合 ,既然 SQL 是 操作 关系 的 语言 ,那么 其 操作 对 象 就 是 元 组 
集合 ,将 元 组 集合 作为 SQL 语句 的 输入 ,查询 语句 的 输出 结果 通常 是 满足 条 件 的 元 组 集合 ， 
更 新 语句 所 影响 的 范围 也 是 一 个 元 组 集合 。SQL 以 面向 集合 的 操作 方式 对 数据 进行 处 理 。 
所 以 在 理解 SQL 语句 时 ,始终 要 意识 到 操作 对 象 和 处 理 结果 均 为 元 组 集合 (与 关系 表 是 同 
一 个 级 别 的 概念 ) ,而 不 是 关系 表 中 的 一 行 或 一 列 。 

5. 简洁 ,通用 功能 强 

SQL 吸取 了 关系 代数 ,关系 演算 语言 两 者 的 特点 和 长 处 , 故 语言 功能 极 强 ,而 且 SQL 
语言 十 分 简洁 ,语法 与 英语 类 似 ,因此 非常 容易 学 习 和 使 用 。 它 已 成 为 关系 数据 库 的 公共 语 
言 。 其 数据 定义 、 查 询 、 操 纵 、 控 制 的 核心 功能 只 用 了 9 个 动词 ,如 表 3-2 所 示 。 


表 3-2 SQL 的 动词 
SQL 功能 核 心动 词 SQL 功能 核心 动词 
数据 查询 SELECT 数据 操纵 INSERT,UPDATE,DELETE 
数据 定义 CREATE,DROP, ALTER 数据 控制 GRANT,REVOKE 


3.1.3 SQL 的 基本 组 成 


1. SQL 数据 库 对 三 级 模式 的 支持 

SQL 支持 关系 数据 库 设 计 中 的 三 级 模式 结构 。 其 中 : 

模式 对 应 于 基本 表 。 在 SQL 中 使 用 CREATE TABLE 语句 定义 的 一 系列 基本 表 
(Base Table) 形 成 了 数据 库 的 模式 ,模式 的 结构 直接 关系 到 数据 库 设计 的 质量 ,因此 在 设计 
过 程 中 应 力求 使 模式 能 够 准确 反映 所 关心 的 数据 。 

内 模式 对 应 存储 文件 (Stored File)。 存 储 文件 位 于 数据 库 系统 的 最 底层 ,其 结构 形成 
了 数据 库 的 内 模式 。 一 个 存储 文件 可 以 存放 一 个 或 多 个 基本 表 , 数 据 量 较 大 的 基本 表 可 以 
存放 在 多 个 存储 文件 中 。 一 般 情况 下 ,用 户 无 须 显 式 地 指明 基本 表 与 存储 文件 之 间 的 映射 
关系 ,DBMS 会 自动 进行 模式 到 内 模式 的 映射 ,该 过 程 对 用 户 是 透明 的 。 

外 模式 对 应 视图 和 部 分 查询 表 。 视 图 (View) 是 从 基本 表 或 其 他 视图 中 导出 的 表 , 是 根 
据 用 户 的 实际 需求 ,在 基本 表 中 定义 的 , 它 本 身 不 独立 存储 在 数据 库 中 ,也 就 是 说 数据 库 中 
只 存放 视图 的 定义 而 不 存放 视图 对 应 的 数据 ,因此 视图 是 一 个 虚 表 。 数 据 仍 存放 在 视图 
所 对 应 的 基本 表 中 ,可 以 在 不 改变 基本 表 结 构 的 前 提 下 , 仅 通 过 修改 视图 的 定义 就 能 够 
更 新 外 模式 ,从 而 实现 数据 的 逻辑 独立 性 。 如 图 3-1 所 示 , 显 示 了 视图 、 表 与 存储 文件 之 
间 的 关系 。 

SQL 语言 中 , 表 是 独立 存在 的 ,在 SQL 中 一 个 关系 对 应 一 个 表 。 行 对 应 元 组 (记录 )， 
列 对 应 属性 (字段 )。 用 户 可 以 用 SQL 语言 对 视图 和 表 进 行 查询 。 在 用 户 眼 中 ,视图 和 表 都 
是 关系 ,而 存储 文件 对 用 户 是 透明 的 。 

表 和 视图 的 关系 ,如 图 3-2 所 示 。 

2. SQL 语句 的 分 类 

SQL 的 核心 功能 由 以 下 部 分 组 成 。 

(1) 数据 定义 语言 (Data Definition Language, DDL)。 主 要 功能 是 创建 各 种 数据 库 的 


SQL 用 户 一 二 | SQL 环境 


存储 文件 存储 文件 存储 文件 
及 索引 1 及 索引 2 及 索引 3 


内 模式 


图 3-1 视图 、 表 与 存储 文件 


ss a 


sno | Sname | Sage Sno | Sdept 


图 3-2 表 与 视图 


对 象 ,包括 数 据 库 模式 、. 表 、 视 图 .索引 等 。 数 据 定义 语言 还 可 以 修改 或 删除 数据 库 对 象 的 
定义 。 

(2) 数据 操纵 语言 (Data Manipulation Language,DML) 。 主 要 功能 是 完成 数据 库 的 查 
询 和 更 新 操作 ,查询 操作 是 指 对 已 存在 的 数据 库 中 的 数据 根据 指定 条 件 进 行 查询 数据 ; 更 
新 操作 用 于 更 新 指定 的 数据 ,包括 插入 新 数据 、 修 改 已 有 数据 和 删除 数据 三 种 操作 。 

(3) 数据 控制 语言 (Data Control Language,DCL)。 主 要 功能 是 完成 数据 库 授权 、 事 务 
管理 以 及 控制 SQL 语句 集 的 运行 。 用 来 授予 或 回收 访问 数据 库 的 某 种 特权 ,控制 数据 操纵 
事务 的 发 生 时 间 及 效果 、 对 数据 库 进行 监视 等 。 

SQL 集 数据 定义 语言 DDL、 数 据 操纵 语言 DML ,数据 控制 语言 DCL 的 功能 于 一 体 , 语 
言 风 格 统一 ,可 以 独立 完成 数据 库 生 命 周 期 中 的 全 部 活动 。 

3. SQL 的 数据 类 型 

在 关系 模型 中 ,一 个 重要 的 概念 是 " 域 "。 每 个 属性 来 自 一 个 域 , 它 的 取 值 必须 是 域 中 
的 值 。 

在 SQL 中 域 的 概念 用 数据 类 型 来 实现 。 在 定义 表 中 的 每 一 个 属性 时 需要 明确 指明 数 
据 类 型 及 长 度 。SQL 的 数据 类 型 说 明 及 其 分 类 如 表 3-3 所 示 。 要 特别 说 明 的 是 ,不 同 的 
RDMS 中 支持 的 数据 类 型 不 完全 相同 。 

在 SQL 中 规定 了 3 类 数据 类 型 : 

@ 预定 义 数据 类 型 。 

@ 构造 数据 类 型 。 

@ 自 定义 数据 类 型 。 
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表 3-3 SQL 的 数据 类 型 及 其 分 类 表 


分 类 类 型 类 型 名 说 明 
INT 整数 类 型 (也 可 写成 INTEGER) 
SMALLINT 短 整 数 类 型 
REAL 浮 点 数 类 型 
数值 型 ”| DOUBLE PRECISION | 双 精 度 浮 点 数 类 型 
FLOAT(n) 浮 点 数 类 型 ,精度 至 少 为 n 位 数字 
定点 数 类 型 ,共有 p 位 数字 (不 包括 符号 .小 数 
NUMERIC(p,d) 点 ,小数点 后 而 有 a 位 教 字 
字符 | CHAR(n) 长 度 为 nn 的 定 长 字符 串 类 型 
预定 义 数 据 | 串 型 VARCHAR(n) 具有 最 大 长 度 为 n 的 变 长 字符 串 类 型 
类 型 位 捉弄 BIT(n) 长 度 为 的 二 进 制 位 串 类 型 
BIT VARYING(n) 最 大 长 度 为 的 变 长 二 进 制 位 串 类 型 
DATE 日 期 类 型 : 年 -月 -日 ( 形 如 YYYY-MM-NN) 
时 间 型 ”| TIME 时 间 类 型 : 时 :分 : 秒 ( 形 如 HH:MM :SS) 
TIMESTAMP 时 间 稚 类 型 (DATE 加 TIME) 
ee oe \FALSE( 假 ) UNKNOWN 


字符 型 大 对 象 和 二 进 制 大 对 象 数据 类 型 值 为 : 
大 型 文件 视频、 音频 等 多 媒体 数据 

由 特定 的 保留 字 和 预定 义 数据 类 型 构造 而 成 ,如 用 “ARRAY” 定 义 的 聚合 类 型 ,用 
“ROW” 定 义 的 行 类 型 ,用 “REF" 定 义 的 引用 类 型 等 

是 一 个 对 象 类 型 ,是 由 用 户 按照 一 定 的 规则 用 预定 义 数据 类 型 组 合 定义 的 自己 专用 
的 数据 类 型 


大 对 象 CLOB 与 BLOB 


构造 数据 类 型 


自 定义 数据 类 型 


注意 : 许多 DBMS 产品 还 扩充 了 其 他 一 些 数 据 类 型 ,如 TEXT( 文 本 )、MONEY( 货 
币 ).GRAPHIC( 图 形 )、IMAGE( 图 像 )、GENERAL( 通 用 ) .MEMO( 备 注 ) 等 。 


3.2 SQL 数据 定义 的 功能 


SQL 数据 定义 语言 (DDL) 允 许 创建 模式 (Schema) 、 基 本 表 (Table) .视图 (View) 和 索 
引 (Index) 等 数据 库 对 象 及 对 这 些 对 象 的 撤销 操作 。 

本 章 使 用 “学 生 -选课 ”数据 库 作为 讲解 SQL 的 示例 数据 库 。“ 学 生 -选课 ”数据 库 描述 
了 学 校 中 学 生 选 课 的 情况 ,包括 学 生 基 本 情况 数据 .课程 数据 和 学 生 选 课 数 据 。 图 3-3 是 
“学 生 -选课 ”数据库 的 E-R 图 ,这 是 一 个 典型 的 多 对 多 关系 ,一 个 学 生 可 以 选择 多 门 课程 ,一 
门 课程 也 可 以 由 多 个 学 生来 选择 。 


学 生 | 到 < 人 选课 之 二 | 课程 


3-3 “学 生 -选课 的 ER 


按照 一 定 的 转换 规则 可 将 E-R 图 转换 为 关系 表 ( 相 关内 容 将 在 第 5 章 介绍 )。 “学生 - 选 
课 ” 数 据 库 包括 3 个 关系 表 , 它 们 分 别 是 : 


学 生 关 系 Student(Sno, Sname, Ssex, Sage, Sdept) 
课程 关系 Course(Cno, Cname, Cpno, Ccredit) 
选课 关系 SC(Sno, Cno, Grade)， 


带 有 下 画 线 的 字段 表示 主 码 。 表 3-4 一 表 3-6 分 别 列 出 了 学 生 关 系 Student、 课 程 关 系 
Course 和 选课 关系 SC 中 的 示例 数据 。 
表 3-4 学 生 关 系 Student 示例 数据 


Sno Sname Sage Ssex Sdept 
1703070101 李 艺 18 女 信息 学 院 
1703070211 王 一 19 男 信息 学 院 
1703070120 张 欣 18 男 信息 学 院 
1703070125 吴 波 19 男 信息 学 院 
1703070302 何 穗 18 女 信息 学 院 
1701030302 张 恒 17 女 机 械 学 院 
1701030322 赵 冬 20 男 机 械 学 院 
1702030315 张 坦 19 男 汽车 学 院 
1704030302 吴 桐 18 女 经 贸 学 院 


表 3-5 课程 关系 Course 示例 数据 


Cno Cname Cpno Ceredit 
03001 数据 库 原理 03005 ~ 
03002 计算 机 网 络 03004 区 
03003 C 语言 程序 设计 03006 8 
03004 通信 原理 03006 8 
03005 数据 结构 03003 6 
03006 数学 12 
03007 信息 系统 03001 4 


表 3-6 学 生 选 课 关 系 SC 示例 数据 


Sno Cno Grade 
1703070101 03001 76 
1703070101 03002 80 
1703070101 03003 90 
1703070211 03001 90 
1703070211 03002 85 
1703070211 03003 80 
1703070125 03002 60 
1703070125 03004 80 
1701030302 03003 84 
1701030302 03006 54 
1701030322 03006 33 
1701030322 03001 57 

3.2.1 模式 的 定义 与 删除 第 


3 
在 一 个 数据 库 中 可 以 包含 一 个 或 多 个 模式 。 其 基本 对 象 有 基本 表 、 视 图 .索引 。 在 不 同 | 章 
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的 模式 中 可 以 定义 名 称 相 同 的 数据 库 对 象 ,如 模式 Schemal 和 Myschema 均 包含 基本 表 
MyTable。 即 模式 起 到 了 命名 空间 (Namespace) 的 作用 ,不 同 模式 中 的 同名 对 象 不 会 产生 
冲突 。 

另外 ,SQL 通常 不 提供 修改 模式 定义 、 修 改 视图 定义 和 修改 索引 定义 的 操作 。 用 户 如 
果 想 修改 这 些 对 象 , 只 能 先 将 它们 删除 ,然后 再 重建 。 

1. SQL 模式 的 定义 

一 个 SQL 模式 是 所 属 基本 表 、 视 图 等 的 集合 。SQL 模式 由 模式 名 和 模式 拥有 者 的 用 
户 名 或 账号 来 确定 ,并 包含 模式 中 每 一 个 元 素 ( 表 、 视 图、 索引 等 ) 的 定义 。 定 义 了 一 个 SQL 
模式 ,就 是 定义 了 一 个 存储 空间 。 在 该 存储 空间 的 数据 库 对 象 全 体 , 构 成 该 模式 对 应 的 
SQL 数据 库 。 在 SQL 中 ,模式 定义 语句 的 语法 格式 如 下 : 

CREATE SCHEMA < 模式 名 > AUTHORIZATION < 用 户 名 >[< CREATE DOMAIN(GRANT) 子 句 > | < CREATE TABLE 子 

名 > | <CRERTE VIEW> | ...... ] 

说 明 : 创建 模式 需 拥 有 DBA 权限 或 获得 DBA 授予 建 模式 的 权限 ; 若 不 指定 < 模式 名 >， 
则 隐 含 为 < 用 户 名 >; 默认 的 方 括号 中 是 在 该 模式 中 ,要 创建 的 域 (授权 )、 表 和 视图 等 子 句 ， 
模式 中 的 表 、 视 图 等 也 可 以 根据 需要 随时 创建 。 

【 例 1】 创建 一 个 学 生 -选课 数据 库 的 模式 S-C 属 主 为 Hong。 


CREATE SCHEMA S — C AUTHORIZATION Hong; 


解 题 说 明 : 

为 用 户 Hong 定义 了 一 个 模式 SC。 

【 例 2】 CREATE SCHEMA AUTHORIZATION Hong; 

解 题 说 明 : 

该 语句 没有 指定 < 模式 名 >, 所 以 < 模式 名 > 隐 含 为 用 户 名 Hong。 

实际 上 ,定义 模式 就 是 定义 了 一 个 命名 空间 ,在 这 个 空间 里 可 以 进一步 定义 该 模式 包含 
的 数据 库 对 象 ,例如 基本 表 、 视 图 和 索引 等 。 

目前 ,在 CREATE SCHEMA 中 可 以 接受 CREATE TABLE,CREATE VIEW 子 句 
等 ,也 就 是 说 用 户 可 以 在 创建 模式 的 同时 在 这 个 模式 定义 中 进一步 创建 基本 表 、 视 图 和 定义 
授权 。 

【 例 3】 

CREATE SCHEMA TEST AUTHORIZATION Hong 


CREATE TABLE Student (Sno CHAR(10), 
Sname CHAR(20), 


Ssex CHAR(2), 
Sage SMALLINT, 
Sdept CHAR(40) 
); 
解 题 说 明 : 
该 语句 为 用 户 Hong 创建 了 一 个 模式 TEST, 并 且 在 其 中 定义 了 一 个 表 Student。 
2. 模式 的 删除 


在 SQL 中 ,模式 删除 语句 的 语法 为 : 


DROP SCHEMA < 模式 名 > [CASCADE | RESTRICT] 


该 语句 有 两 个 删除 模式 的 方式 : 
(1) 如 果 选 定 了 CASCADE 方式 (级 联 式 ), 则 进行 级 联 删 除 。 即 当 执行 该 语句 时 ,在 删 


除数 据 库 模 式 时 , 则 本 数据 库 模式 和 其 下 属 的 基本 表 、 视 图 .索引 等 全 部 数据 库 对 象 都 将 被 
删除 。 


(2) 如 果 指 定 了 RESTRICT 方式 (约束 式 ), 则 进行 限定 删除 。 这 时 语句 只 能 删除 空 模 


式 。 即 本 数据 库 模式 下 属 的 基本 表 、 视 图 .索引 等 要 事先 清除 ,才能 执行 DROP SCHEMA 
语句 ,否则 拒绝 删除 。 


句 。 


【 例 4】 删除 学 生 选 课 数据 库 模 式 S-C。 

DROP SCHEMA S—C ; 

解 题 说 明 : 

该 题 没有 指定 删除 方式 ,默认 删除 方式 是 RESTRICT。 

【 例 S】 删除 模式 TEST 以 及 其 下 包含 的 所 有 数据 库 对 象 。 

DROP SCHEMA TEST CASCADE; 

解 题 说 明 : 

该 题 指定 了 删除 方式 为 CASCADE, 级 联 删 除 。 

需要 注意 的 是 : 模式 一 般 要 定义 在 数据 库 中 ,而 SQL 标准 中 并 没有 规定 数据 库 定义 语 
为 此 ,有 些 数据 库 产品 提供 了 扩展 的 CREATE DATABASE 语句 用 于 定义 数据 库 。 不 


同 产品 中 定义 数据 库 的 语法 也 不 尽 相同 ,使 用 时 需要 参考 具体 DBMS 产品 的 详细 文档 。 
3.2.2 表 的 建立 、 删 除 与 修改 


1. 表 的 建立 
创建 了 一 个 模式 ,就 创建 了 一 个 数据 库 的 命名 空间 ,一 个 框架 。 在 这 个 空间 中 首先 要 定 


义 的 是 该 模式 包含 的 数据 库 的 基本 表 。 


SQL 语言 使 用 CREATE TABLE 语句 定义 表 , 其 一 般 格式 如 下 : 


CREATE TABLE [模式 名 . ]< 表 名 > 
(< 列 名 >< 数 据 类 型 >[ 列 级 完整 性 约束 条 件 ]， 
[< 列 名 >< 数 据 类 型 >[ 列 级 完整 性 约束 条 件 ], 


[< 表 级 完整 性 约束 1 >], 
[< 表 级 完整 性 约束 2>], 


); 


创建 基本 表 时 需要 制定 表 名 、 表 中 每 个 列 的 定义 ,以 及 完整 性 约束 情况 。 
其 中 < 表 名 > 是 所 要 定义 的 关系 的 名 字 , 可 以 想象 为 搭建 一 个 用 于 容纳 数据 的 框架 , 它 


可 以 由 一 个 或 多 个 属性 列 组 成 。 每 一 个 列 的 数据 类 型 可 以 是 预定 义 数据 类 型 ,也 可 以 是 用 
户 定义 数据 类 型 。 另 外 建 表 的 同时 通常 还 可 以 定义 与 该 表 有 关 的 完整 性 约束 条 件 。 这 些 完 
整 性 约束 条 件 被 存 人 系统 的 数据 字典 中 , 当 用 户 操作 表 中 数据 时 ,由 DBMS 自动 检查 该 操 
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作 是 否 违背 这 些 完 整 性 约束 条 件 。 关 于 完整 性 约束 的 具体 内 容 将 在 第 7 章 介 绍 。 

【 例 6】 对 于 表 3-4 一 表 3-6 所 示 的 学 生 -选课 数据 库 中 的 如 下 三 个 表 结 构 , 用 SQL 语 
言 定义 之 。 

学 生 关系 Student(Sno, Sname, Ssex, Sage, Sdept) 


课程 关系 Course(Cno、Cname、Cpno、Ccredit) 
选课 关系 SC(Sno、Cno、Grade) 


用 SQL 语句 创建 一 个 表 应 指出 它 放 在 哪个 模式 中 ,为 简单 起 见 , 这 里 省 略 了 模式 名 S- 
C, 即 在 默认 的 目录 及 模式 下 ,Student 表 可 定义 如 下 : 


CREATE TABLE Student 
(Sno CHAR (10), 
Sname CHAR (20) NOT NULL, 
Sage NUMERIC (2), 
Ssex CHAR (2), 
Sdept CHAR (20) 
PRIMARY KEY( Sno) ) ; 


解 题 说 明 : 

上 面 的 语句 在 数据 库 中 创建 了 基本 表 Student。 该 表 由 5 列 组 成 ,分 别 为 学 号 、 姓 名 \ 年 
龄 ,性 别 和 所 属 学 院 。 每 个 列 的 定义 必须 指明 列 名 和 数据 类 型 ,然后 是 可 选 的 列 级 完整 性 约 
束 。 考 虑 到 姓名 列 不 为 空 ,因此 为 Sname 添加 非 空 约 束 NOT NULL。 表 级 完整 性 约束 将 
Sno 列 定义 为 主 码 , 由 于 主 码 强制 满足 非 空 和 唯一 约束 ,因此 不 必 为 Sno 定义 NOT NULL。 
凡 带 有 NOT NULL 的 列 ,表示 不 允许 出 现 空 值 ; 反之 ,可 以 出 现 空 值 。 当 首次 用 CREATE 
TABLE 定义 一 个 新 表 后 ,只 是 建立 了 一 个 无 值 的 表 结构 ,并 将 有 关 * 学 生 ” 表 的 定义 及 有 关 
约束 条 件 放 在 数据 字典 中 。 

类 似 地 ,可 以 定义 学 生 -选课 数据 库 中 的 Course 表 如 下 : 

CREATE TABLE Course 

(Cno CHAR (5), 

Cname CHAR (40) NOT NULL, 

Cpno CHAR (5), /* Cpno 的 含义 是 先 修 课 * / 

Ccredit NUMERIC (2), 

FOREIGN KEY (Cpno)REFERENCES Course(Cno), 

/* 表 级 完整 性 约束 条 件 ,Cpno 是 外 码 , 被 参照 表 是 Course, 被 参照 列 是 Cno * / 

PRIMARY KEY (Cno) ); 

解 题 说 明 : 

参照 表 和 被 参照 表 可 以 是 同一 个 表 。 

对 于 学 生 -选课 数据 库 中 的 SC 表 , 可 定义 如 下 : 

CREATE TABLE SC 

(Sno CHAR (10), 

Cno CHAR (5), 

Grade NUMERIC (3), 


PRIMARY KEY (Sno, Cno), 
FOREIGN KEY (Sno) ” REFERENCES Student (Sno),/* 表 级 完整 性 约束 条 件 , Sno 是 外 码 , 被 参照 表 是 


Student, 被 参照 列 是 Sno * /。 

FOREIGN KEY (Cno) REFERENCES Course(Cno)/* 表 级 完整 性 约 东 条 件 , Cno 是 外 码 , 被 参照 表 是 
Course, 被 参照 列 是 Cno * / 

ss 

2. 表 的 扩充 和 修改 

随 着 应 用 环境 和 应 用 需求 的 变化 ,用 户 的 需求 也 会 随 之 发 生变 化 ,基本 表 的 结构 必然 要 
进行 相应 的 调整 。 包 括 增加 新 列 、 修 改 原 有 的 列 定义 ,或 增加 新 的 ,删除 已 有 的 完整 性 约束 
条 件 等 。 对 于 已 经 装载 了 大 量 数据 的 表 , 或 者 被 其 他 数据 库 对 象 引 用 (如 参照 完整 性 ) 的 表 ， 
调整 表 结构 不 宜 采取 删除 重建 的 办 法 ,SQL 提供 了 ALTER TABLE 语句 用 于 修改 基本 表 ， 
其 语法 格式 为 : 

ALTER TABLE < 表 名 > 

[ADD [COLUMN] < 新 列 名 >< 数 据 类 型 > [完整 性 约束 条 件 ] 

[DROP [COLUMN]< 列 名 >[RESTRICT |CASCADE ] 

[ALTER COLUMN < 列 名 >< 数 据 类 型 >]; 

要 修改 的 基本 表 由 < 表 名 > 指定 。 

Oa 在 现存 表 中 增加 新 列 。 

ADD 子 句 用 于 向 基本 表 中 添加 新 列 和 新 的 完整 性 约束 条 件 ,描述 新 列 的 语法 格式 与 
CREATE TABLE 中 定义 列 的 格式 相同 。 

【 例 7】 在 学 生 表 Student 中 增加 “email" 列 ,用 于 存储 学 生 的 电子 邮件 地 址 。 

ALTER TABLE Student ADD email VARCHAR (100) 

解 题 说 明 : 

无 论 基 本 表 中 原来 是 否 已 有 数据 ,新 增加 的 列 一 律 为 空 值 。 如 果 新 增 列 设置 了 默认 值 
(使 用 DEFAULT 子 句 ), 则 使 用 该 默认 值 填充 新 增 列 。 如 果 新 增 列 上 定义 了 NOT NULL 
约束 而 又 未 定义 默认 值 ,那么 添加 列 操作 会 执行 失败 。 

【 例 8】 增加 课程 名 称 必须 取 唯 一 值 的 约束 条 件 。 


ALTER TABLE Course ADD UNIQUE(Cname); 


@ 删除 已 存在 的 某 个 列 。 
DROP 子 句 用 于 删除 表 中 已 有 的 列 和 完整 性 约束 条 件 。 其 一 般 格 式 如 下 : 


ALTER TABLE < 表 名 > DROP[ COLUMN]< 列 名 >[RESTRICT|CASCADE]; 


说 明 : 其 中 ,CASCADE 表示 在 基本 表 中 删除 某 列 时 ,所 有 引用 该 列 的 视图 和 约束 也 自 
动 删除 ; RESTRICT 在 没有 视图 或 约束 引用 该 属性 时 ,才能 被 删除 。 
【 例 9】 把 Course 表 中 的 Cpno 列 删除 。 


ALTER TABLE Course DROP Cpno; 


@ 修改 原 有 列 的 类 型 。 
ALTER COLUMN 子 句 用 于 修改 已 有 列 的 定义 。 
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【 例 10】 将 年 龄 的 数据 类 型 由 NUMERIC 型 改 为 INT 型 。 
ALTER TABLE Student ALTER COLUMN Sage INT; 


解 题 说 明 : 

ALTER TABLE 修改 的 是 表 本 身 的 结构 ( 即 表 的 定义 ) ,而 不 是 表 中 装载 的 数据 。 
3. 表 的 删除 

如 果 不 再 需要 某 个 基本 表 , 可 以 使 用 DROP TABLE 语句 删除 它 。 其 一 般 格 式 为 : 


DROP TABLE < 表 名 > [RESTRICT|CACSADE] 


该 语句 会 将 基本 表 连 同 其 中 存储 的 数据 一 并 删除 。 如 果 只 想 清空 表 中 的 数据 ,而 不 想 
删除 表 本 身 ,不 要 使 用 DROP TABLE 语句 。 

如 果 指 定 了 CACSADE 方式 , 则 进行 级 联 删除 。 即 随 着 基本 表 的 删除 , 表 中 的 数据 、 表 
本 身 以 及 在 该 表 上 所 建 的 索引 和 视图 将 全 部 随 之 消失 。 

如 果 指 定 了 RESTRICT 方式 , 则 进行 限制 删除 。 即 只 有 在 先 清除 了 表 中 的 全 部 记录 
行 数据 ,以 及 在 该 表 上 所 建 的 索引 和 视图 ,并 该 表 不 能 被 其 他 表 的 外 码 所 引用 时 ,才能 删除 
一 个 空 表 ,否则 DBMS 会 拒绝 删除 该 基本 表 。 

如 果 不 指定 删除 方式 ,默认 删除 方式 是 RESTRICT。 

【 例 11】 设 有 建立 的 已 退学 学 生 表 Student-quit, 删 除 该 表 。 


DROP TABLE Student 一 quit CASCADE; 


解 题 说 明 : 

注意 该 基本 表 定 义 一 旦 删除 , 表 中 的 数据 、 此 表 上 建立 的 索引 ,视图 、 触 发 器 等 有 关 对 象 
都 将 自动 被 删除 。 因 此 ,执行 删除 基本 表 的 操作 时 一 定 要 格外 小 心 。 

注意 : 不 同 的 数据 库 产品 在 遵循 SQL 标准 的 基础 上 ,以 及 在 具体 实现 细节 和 处 理 策 略 
上 会 与 标准 有 差异 。 下 面 就 SQL2011 标准 对 DROP TABLE 的 规定 ,对 比分 析 Kingbase 
ES、ORACLE 9i、MS SQL Server 2012 这 三 种 数据 库 产品 对 DROP TABLE 的 不 同 处 理 
策略 。 

表 中 的 R 表示 RESTRICT, 即 DROP TABLE < 基本 表 名 > RESTRICT; C 表示 
CACSADE, 即 DROP TABLE < 基本 表 名 > CACSADE; 其 中 Oracle 12c 没有 RESTRICT 
选项 ; SQL SERVER 2012 没有 RESTRICT 和 CACSADE 选项 。 

表 3-7 为 上 述 几 种 数据 库 在 进行 DROP TABLE 时 ,SQL2011 与 3 个 RDBMS 的 处 理 
策略 比较 。 


表 3-7 DROP TABLE 时 ,SQL2011 与 3 个 RDBMS 的 处 理 策略 比较 


标准 及 主流 数据 库 的 SQL2011 |Kingbase ES|ORACLE12c Oe 
序号 处 理 方式 SERVER 2012 
依赖 基本 表 的 对 象 R C 及 C 尼 
+ | 案 引 无 规定 V V VV V J 
Vv NA A 
2 | 视图 x V x 保留 | 保留 保留 


续 表 


标准 及 主流 数据 库 的 SQL2011 |Kingbase ES|ORACLE12c MOE 
序号 处 理 方式 SERVER 2012 
依赖 基本 表 的 对 象 恒 医 恒 医 汉民 > 
DEFAULT,PRIMARY KEY, CHECK 
3 | (只 合 该 表 的 列 INOT NULL 等 约 东 | YIVYIVYIY|IYvIY 学 
4 | 外 码 Foreign Key 次 NA x V 六 ~ x 
5 触发 器 TRIGGER x Vv x V NA ~V ~ 
ye | | JV 
6 | 西数 或 存储 过 各 XX | Y | 保留 | 保留 | 保留 | 保留 | 保留 


“Xx "表示 不 能 删除 基本 表 ,“ "表示 能 删除 基本 表 ,“ 保 留 ”表示 删除 基本 表 后 ,还 保留 依赖 对 象 。 


从 比较 表 中 可 以 知道 : 

(1) 对 于 索引 ,删除 基本 表 后 ,这 3 个 RDBMS 都 自动 删除 该 基本 表 上 已 经 建立 的 所 有 
索引 。 

(2) 对 于 视图 ,ORACLE 12c 与 SQL SERVER 2012 是 删除 基本 表 后 ,还 保留 此 基本 表 
上 的 视图 定义 ,但 是 已 经 失效 。KingbaseES 分 两 种 情况 , 若 删除 基本 表 时 带 RESTRICT 选 
项 , 则 不 可 以 删除 基本 表 ; 若 删除 基本 表 时 带 CASCADE 选项 ,可 以 删除 基本 表 , 同 时 也 删 
除 视图 ; KingbaseES 的 这 种 策略 符合 SQL 2011 标准 。 

(3) 对 于 存储 过 程 和 函数 ,删除 基本 表 后 ,这 3 个 数据 库 产 品 都 不 自动 删除 建立 在 此 基 
本 表 上 的 存储 过 程 和 函数 ,但 是 已 经 失效 。 

(4) 如 果 欲 删除 的 基本 表 上 有 触发 器 ,或 者 被 其 他 基本 表 的 约束 所 引用 (CHECK， 
FOREIGN KEY 等 ) ,读者 可 以 从 比较 表 中 得 到 这 3 个 系统 的 处 理 策 略 ,这 里 就 不 一 一 说 
明了 。 

同样 ,对 于 其 他 的 SQL 语句 ,不 同 的 数据 库 产品 在 处 理 策 略 上 会 与 标准 有 所 差别 。 因 
此 ,如 果 发 现 本 书 中 个 别 例子 在 某 个 数据 库 产品 上 不 能 通过 时 ,请 读者 参见 有 关 产 品 的 用 户 
手册 ,适当 修改 即 可 。 


3.2.3 索引 的 建立 与 删除 


索引 机 制 对 数据 库 中 基本 表 的 作用 ,类 似 于 目录 对 书 的 作用 。 建 立 索 引 的 目的 是 为 了 
加 快 查询 速度 。 用 户 可 以 根据 应 用 环境 的 需要 ,在 一 个 基本 表 中 建立 一 个 或 多 个 索引 ,以 提 
供 多 种 存 取 路 径 , 加 快 数据 查询 速度 。 基 本 表 文件 和 索引 文件 一 起 构成 了 数据 库 系 统 的 内 
模式 。 

1. 索引 的 作用 

索引 的 作用 有 以 下 3 个 方面 。 

(1) 使 用 索引 可 以 明显 地 加 快 数据 查 询 的 速度 

在 大 型 数据 库 中 ,有 时 基本 表 文 件 中 的 列 可 能 有 上 百 列 , 而 且 元 组 也 可 能 达到 数 万 个 ， 
因此 数据 文件 会 很 大 。 在 不 使 用 索引 进行 数据 查询 时 ,通常 的 做 法 是 将 数据 文件 分 块 ,逐个 
读 到 内 存 , 然 后 进行 查找 的 比较 操作 。 而 使 用 索引 后 , 先 将 索引 文件 读 和 内存 ,根据 索引 项 
找到 元 组 的 地 址 ,然后 再 根据 地 址 将 元 组 数据 直接 读 人 计算 机 。 由 于 索引 文件 中 只 含有 索 
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引 项 和 元 组 地 址 , 它 的 结构 远 比 表 结构 紧凑 ,所 以 文件 较 小 ,一 般 可 一 次 读 和 内存 。 并 且 由 
于 索引 文件 中 的 索引 项 是 经 过 排序 的 ,可 以 很 快 地 找到 索引 项 值 和 元 组 地 址 。 显 然 , 使 用 索 
引 大 大 减少 了 磁盘 的 1/O 次 数 ,从 而 可 以 加 快 查询 速度 。 特 别 是 对 于 数据 文件 大 的 基本 
表 , 使 用 索引 能 显著 加 快 查询 速度 。 

(2) 使 用 索引 可 保证 数据 的 唯一 性 

索引 的 定义 中 包括 定义 数据 唯一 性 的 内 容 。 当 定义 了 数据 唯一 性 的 功能 后 ,在 对 相关 
的 索引 项 进行 数据 输入 和 更 改 时 ,系统 要 进行 检查 ,以 确保 其 数据 唯一 性 成 立 。 

(3) 使 用 索引 可 以 加 快 连接 速度 

在 两 个 关系 进行 连接 操作 时 ,系统 需要 在 连接 关系 中 对 每 一 个 被 连接 字段 查询 操作 ,其 
查询 工作 量 是 非常 大 的 。 显 然 , 如 果 在 连接 文件 的 连接 字段 上 建 有 索引 , 则 可 以 大 大 提高 连 
接 操作 效率 。 所 以 ,许多 系统 要 求 连接 文件 必须 有 相应 索引 ,才能 执行 连接 操作 。 例 如 要 实 
现 学 生 和 选课 的 连接 操作 ,就 要 求 在 选课 表 中 必须 在 学 号 (外 码 ) 上 建立 索引 ,否则 数据 连接 
的 操作 速度 会 非常 慢 。 

2. 建立 索引 的 原则 

建立 索引 是 加 快 数据 查询 的 有 效 手段 ,但 不 是 所 有 的 情况 下 都 需要 建立 索引 。 用 户 在 
建立 索引 时 ,应当 依照 以 下 原则 。 

1) 索引 的 建立 和 维护 由 DBA 和 DBMS 完成 

索引 由 数据 库 管 理 员 DBA 或 表 的 属 主 (Owner) 负 责 建 立 和 删除 ,其 他 用 户 不 能 随意 建 
立 和 删除 索引 。 索 引 由 系统 自动 选择 和 维护 ,也 就 是 说 ,不 需要 用 户 指定 使 用 索引 ,也 不 需 
要 用 户 打开 索引 或 对 索引 执行 重 索 引 操作 ,这 些 工 作 都 由 DBMS 自动 完成 。 

2) 大 表 应 当 建 索引 ,小 表 则 不 必 建 索引 

只 有 大 表 建 立 索 引 后 加 快 查询 速度 的 效果 明显 。 相 反 , 对 于 记录 比较 少 的 基本 表 , 建 立 
索引 的 意义 不 大 。 

3) 对 于 一 个 基本 表 , 不 要 建立 过 多 的 索引 

索引 文件 要 占用 文件 目录 和 存储 空间 ,索引 过 多 会 增加 系统 的 额外 开销 。 索 引 需 要 自 
身 维护 , 当 基本 表 的 数据 增加 、 删 除 或 修改 时 ,索引 文件 要 随 之 变化 ,以 便 与 基本 表 保 持 一 
致 。 显 然 , 索 引 过 多 会 影响 数据 增加 、 删 除 、 修 改 的 速度 。 

索引 要 根据 数据 查询 或 处 理 的 要 求 建立 。 对 那些 查询 频 度 高 、 实 时 性 要 求 高 的 数据 一 
定 要 建立 索引 ,而 对 于 其 他 的 数据 则 不 建立 索引 。 

早期 的 SQL 标准 中 采用 了 索引 技术 ,但 是 SQL 新 标准 不 主张 使 用 索引 ,而 是 在 创建 表 
时 直接 定义 主 码 取而代之 ,一 般 系统 会 自动 在 主 码 上 建立 索引 。 但 有 时 会 有 特殊 需要 ,系统 
在 存 取 数据 时 会 选择 合适 的 索引 作为 存 取 路 径 , 用 户 不 必 也 不 能 显 式 地 选择 索引 。 

3. 创建 索引 

在 基本 表 上 可 建立 一 个 或 多 个 索引 ,目的 是 提供 多 种 存 取 路 径 , 加 快 查找 速度 ,建立 索 
引 的 一 般 格式 为 : 


CREATE [UNIQUE ] [CLUSTER) ] INDEX < 索引 名 > 
ON < 表 名 >(< 列 名 1> [ASC|DESC],< 列 名 2> [ASC|DESC]],.…); 


其 中 : 

@ < 表 名 > 是 要 建 索 引 的 基本 表 的 名 字 。 索 引 可 以 建 在 该 表 的 一 列 或 多 列 上 ,各 列 名 之 
间 用 逗号 分 开 ; 

@ 每 个 < 列 名 > 后 面 还 可 以 用 LASCIDESC] 指 定 索引 值 的 排列 次 序 ,次 序 可 选 ASC( 升 
序 ) 或 DESC( 降 序 ) ,默认 值 为 ASC; 

@ UNIQUE 表示 该 索引 的 每 一 个 索引 值 只 对 应 唯一 的 数据 记录 ; 

@ CLUSTER 表示 要 建立 的 索引 是 聚 秘 索 引 。 所 谓 聚 秘 索 引 是 指 索引 项 的 顺序 与 表 
中 记录 的 物理 顺序 一 致 的 索引 组 织 。 用 户 可 以 在 最 常 查询 的 列 上 建立 聚 簇 索引 ,以 提高 查 
询 效 率 。 但 一 个 基本 表 上 最 多 只 能 建立 一 个 聚 簇 索 引 。 这 是 因为 建立 聚 簇 索 引 后 ,更 新 索 
引 列 数据 时 ,往往 导致 表 中 记录 的 物理 顺序 的 变更 ,代价 较 大 ,因此 对 于 经 常 更 新 的 列 不 宜 
建立 聚 簇 索 引 。 

【 例 12】 为 学 生 -选课 数据 库 中 的 Student,Course,SC 三 个 表 建 立 索 引 , 其 中 Student 
表 按 学 号 升序 建 唯一 索引 ,Course 表 按 课程 号 升序 建 唯一 索引 ,SC 表 按 学 号 升序 和 课程 号 
降序 建 唯 一 索引 。 

CREATE UNIQUE INDEX Sindex ON Student (Sno) ; 


CREATE UNIQUE INDEX Cindex ON Course (Cno); 
CREATE UNIQUE INDEX SCindex ON SC (Sno ASC, Cno DESC); 


4. 有 咀 除 索引 

索引 建立 之 后 ,就 由 系统 来 选择 和 维护 ,用 户 无 须 干 预 。 我 们 知道 ,建立 索引 的 目的 是 
为 了 减少 查询 操作 的 时 间 ,提高 系统 的 查找 效率 。 但 如 果 数 据 增加 、\ 删 除 、 修 改 频 繁 ,系统 就 
会 花费 大 量 的 时 间 来 维护 索引 ,这 样 就 得 不 偿 失 了 ,因此 ,有 时 需要 删除 一 些 不 必要 的 索引 。 
SQL 语言 使 用 DROP INDEX 语句 删除 索引 ,删除 索引 的 一 般 格 式 为 : 


DROP INDEX [ON < 表 名 >] < 索引 名 > 


该 命令 删除 < 索引 名 > 指定 的 索引 ， 
[LON < 表 名 >] 是 任 选 项 ,可 以 确认 该 索引 是 否 是 这 张 表 的 索引 。 
【 例 13】 删除 按 学 号 所 建立 的 索引 。 


DROP INDEX Sindex; 


解 题 说 明 : 

Q@ 删除 索引 时 ,系统 会 同时 从 数据 字典 中 删 去 有 关 该 索引 的 描述 。 

@ 但 要 注意 : 在 使 用 DROP INDEX 删除 索引 时 ,只 能 删除 用 户 自己 建立 的 索引 ,不 能 
删除 其 他 用 户 建立 的 索引 ,除非 其 他 用 户 赋予 了 你 删除 索引 的 权限 。 

在 RDBMS 中 索引 一 般 采 用 B 十 树 ,HASH 索引 来 实现 。B 十 树 索 引 具 有 动态 平衡 的 
优点 。HASH 索引 具有 查找 速度 快 的 特点 。 索 引 是 关系 数据 库 内 部 实现 的 技术 ,属于 内 模 
式 的 范畴 。 

用 户 在 建立 索引 时 .可 以 定义 索引 是 唯一 索引 、 非 唯一 索引 或 聚 簇 索引 。 至 于 该 索引 是 
采用 B 十 树 还 是 HASH 索引 则 由 具体 的 RDBMS 来 实现 。 
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3.3 数据 查询 


数据 查询 是 数据 库 的 核心 操作 。 该 功能 是 指 根据 用 户 的 需要 以 一 种 可 读 的 方式 从 数据 
库 中 提取 所 需 数据 。 SELECT 语句 是 SQL 语言 中 功能 最 强大 的 语句 ,也 是 最 常见 的 数据 
操纵 语句 。 


3.3.1 数据 查询 的 基本 语法 


SQL 的 数据 查询 语句 中 包括 SELECT,FROM,WHERE,GROUP BY 和 ORDER BY 
子 句 。SELECT 语句 具有 数据 查询 、 统 计 、 分 组 和 排序 的 功能 ,其 语句 表达 能 力 非常 
强大 。 

1. SELECT 语句 的 语法 

SELECT 语句 的 语法 格式 为 : 

SELECT[ ALL|DISTINCT]< 目 标 列 表达 式 >[ 别 名 ][,< 目 标 列 表达 式 >[ 别 名 ]].…… 

FROM < 表 名 或 视图 名 >[ ,< 表 名 或 视图 名 >].…… 

[WHERE < 条 件 表达 式 >] 

[GROUP BY < 属性 列 1 >[HAVING < 条 件 表达 式 >]] 

[ORDER BY < 属性 列 2 >[ASC|DESC]]; 

SELECT 查询 语句 的 功能 是 ,根据 WHERE 子 句 的 条 件 表 达 式 ,从 FROM 子 句 指定 的 
数据 源 (基本 表 或 视图 ) 中 ,选择 满足 元 组 选择 条 件 的 元 组 数据 ,再 按 SELECT 子 句 中 的 目 
标 列 表达 式 , 选 出 元 组 中 的 属性 值 形成 结果 表 , 并 对 它们 进行 分 组 ,统计 、 排 序 和 投影 ,形成 
查询 结果 集 。 

在 查询 语句 中 共有 5 种 子 句 ,其 中 SELECT 和 FROM 语句 为 必 选 子 句 ,而 WHERE、 
GROUP BY 和 ORDER BY 子 句 为 任 选 子 句 。 下 面 分 别 叙 述 各 子 句 的 功能 。 

1) SELECT 子 句 

SELECT 子 句 用 于 指明 查询 结果 集 的 目标 列 。 目 标 列 可 以 是 直接 从 数据 源 中 投影 得 
到 的 字段 .与 字段 相关 的 表达 式 或 数据 统计 的 函数 表达 式 ,目标 列 还 可 以 是 常量 。 如 果 目 标 列 
中 使 用 了 两 个 基本 表 ( 或 视图 ) 中 相同 的 列 名 , 则 要 在 列 名 前 加 表 名 限定 ,即使 用 “< 表 名 >. 
< 列 名 >” 表 示 。 

SELECT 语句 既 可 以 完成 简单 的 单 表 查询 ,也 可 以 完成 复杂 的 连接 查询 和 榜 套 查询 。 

2) FROM 子 句 

FROM 子 句 用 于 指明 查询 的 数据 源 。 查 询 操作 需要 的 数据 源 指 基本 表 ( 或 视图 表 ) 组 ， 
表 间 用 “, ”分割 。 如 果 查 询 使 用 的 基本 表 或 视图 不 在 当前 数据 库 中 ,还 需要 在 表 或 视图 前 加 
上 数据 库 名 加 以 说 明 ,即使 用 “< 数据 库 名 >. < 表 名 >” 的 形式 表示 。 如 果 在 查询 中 需要 一 表 
多 用 , 则 每 种 使 用 都 需要 一 个 表 的 别名 标识 ,并 在 各 自 使 用 中 用 不 同 的 表 别 名 表示 。 

定义 表 别 名 的 格式 为 “< 表 名 >. < 别名 >”。 

3) WHERE 子 句 

WHERE 子 句 通过 条 件 表达 式 描述 关系 中 元 组 的 选择 条 件 。DBMS 处 理 语句 时 , 按 元 


组 为 单位 ,逐个 考察 每 个 元 组 是 否 满足 条 件 ,将 不 满足 条 件 的 元 组 筛选 掉 。 

4) GROUP BY 子 句 

GROUP BY 子 句 的 作用 是 按 < 属 性 列 1 > 的 值 对 结果 集 进行 分 组 ,即将 该 属性 列 值 相 
等 的 元 组 为 一 组 。 每 个 组 产生 结果 表 中 的 一 条 记录 。 当 SELECT 子 句 后 的 目标 列 中 有 统 
计 函 数 ,如 果 查 询 语 句 中 有 分 组 子 句 , 则 统计 为 分 组 统计 ,和 否则 为 对 整个 结果 集 统计 。 如 果 
GROUP BY 子 句 带 HAVING 短语 ,组 选择 条 件 为 带 有 函数 的 条 件 表 达 式 , 则 只 有 满足 指 
定 条 件 的 组 才能 输出 。 

5) ORDER BY 子 句 

ORDER BY 子 句 的 作用 是 对 结果 集 进行 排序 。 如 果 有 ORDER BY 子 句 , 则 最 终结 果 
表 还 要 按 < 属性 列 2 > 的 值 的 升序 或 降序 排序 。 当 排序 要 求 为 ASC 时 ,元 组 按 排 序列 值 的 升 
序 排序 ; 排序 要 求 为 DESC 时 ,结果 集 的 元 组 按 排序 列 值 的 降序 排列 。 

2. SELECT 语句 的 操作 符 

SELECT 语句 中 使 用 的 操作 符 包 括 算 术 操 作 符 、 比 较 操 作 符 、 逻 辑 操 作 符 ,组合 查 询 操 
作 符 和 在 字段 中 出 现 的 其 他 操作 符 。 下 面 介绍 这 5 类 操作 符 。 

1) 算术 操作 符 

算术 操作 符 在 SQL 语句 中 表达 数学 运算 操作 。SQL 的 数学 运算 操作 符 只 有 4 种, 它 
们 是 十 (加 号 ) 一 ( 减 号 )、*x ( 乘 号 ) 和 /( 除 号 )。 

2) 比较 操作 符 

比较 操作 符 用 于 测试 两 个 数据 是 否 相 等 .不 等 .小 于 或 大 于 某 个 值 。SQL 中 的 比较 操 
作 符 包括 ==( 等 于 ) ,二 (大 于 ) 二 (小 于 ) .三 =( 小 于 等 于 ) 二 =( 大 于 等 于 )!= 或 二 (不 等 
于 )、! 二 (不 大 于 ) 和 ! 二 (不 小 于 ) 共 8 种 操作 符 。 

3) 逻辑 操作 符 ( 见 表 3-8) 

表 3-8 SQL 的 逻辑 操作 符 


语 义 操 作 者 使 用 格式 或 示例 示例 解释 
在 [不 在 ] 其 中 [NOTJ IN < 字段 > IN(< 数 据 表 | 子 查询 >) ”将 字段 值 与 数据 表 | 子 查询 的 
结果 集 比较 ,看 字段 值 在 [不 
在 ] 数 据 表 或 结果 集中 
任何 一 个 ANY < 字段 > < 比较 符 > ANY( 数 据 表 测试 字段 值 是 否 大 于 数据 表 
| 子 查询 ) 例 : < 字段 >>> ANY 或 子 查询 结果 集中 的 任何 一 
(数据 表 | 子 查询 ) 个 值 
全 部 (每 个 ) ALL < 字段 > < 比较 符 > ALL( 数 据 表 测试 字段 值 是 否 大 于 数据 表 
| 子 查询 ) 例 : < 字段 >>ALL( 数 或 子 查询 结果 集中 的 每 一 
据 表 | 子 查询 ) 个 值 
[不 ] 存 在 [NOTJEXISTS EXISTS (< 子 查询 >) 测试 子 查 询 结 果 集 中 有 [ 没 
有 J 记录 
在 [不 在 ] 范 围 [NOT] BETWEEN < 字段 >LNOT]BETWEEN 小 测试 字段 在 [不 在 ] 给 定 的 小 
AND… 值 AND 大 值 值 和 大 值 的 范围 中 
是 [不 是 ] 空 值 ”IS [NOT] NULL < 字段 > IS [NOT] NULL 测试 字段 是 [不 是 ] 空 值 


关系 数据 亩 标准 语言 SQL 


数据 库 原 理 及 应 用 坟 程 一 -SQL Server 2014 


续 表 
语 义 操 作 者 使 用 格式 或 示例 示例 解释 
模式 比较 [NOT] LIKE < 字段 >[NOT] LIKE < 字符 常 测试 字段 是 否 与 给 定 的 字符 
数 > 其 中 ,字符 常数 中 含有 下 画 模式 匹配 
线 ““”( 单 字符 通配符 ) 和 百 分 
号 %( 任 意 长 度 字 符 通 配 符 ) 
与 运算 AND < 条 件 1> AND < 条 件 2> 测试 条 件 1 和 条 件 2 是 否 都 
满足 要 求 
或 运算 OR < 条 件 1> OR < 条 件 2> 测试 条 件 1 和 条 件 2 是 否 有 
一 个 满足 要 求 
非 运算 NOT NOT < 条 件 > 测试 条 件 是 否 不 满足 要 求 


可 以 看 出 ,SQL 的 多 辑 操作 符 种 类 比较 多 ,功能 也 很 强大 。 在 这 些 罗 辑 操作 符 中 ,有 些 
是 读者 比较 熟悉 ,在 其 他 计算 机 语言 也 曾 遇 到 过 的 ,例如 NOT、AND 和 OR, 其 语义 和 使 用 
方法 读者 应 该 比较 清楚 ; 还 有 一 些 可 能 不 太 熟 悉 , 例 如 IN、ANY、LIKE 等 迎 辑 操作 符 , 在 
后 续 的 例题 中 会 对 它们 作 更 详细 和 深入 的 介绍 。 

4) 组 合 查 询 操 作 符 

SQL 的 组 合 查询 操作 符 是 针对 传统 关系 运算 的 操作 符 , 它 包括 UNION (并 查询 )、 
EXCEPT( 差 查询 ) 和 INTERSECT( 交 查询 ), 共 3 种 。 组 合 查询 操作 符 的 使 用 格式 为 : 

< 查询 1 >< 组 合 操作 符 >< 查 询 2> 

Q@ UNION 操作 符 ,并 查询 操作 。 操 作 结果 为 将 < 查询 1 > 和 < 查询 2 > 的 结果 合并 , 即 
取 < 查 询 1 > 和 < 查询 2 > 的 元 组 ,并 在 结果 集中 去 掉 重 复 行 。 

@ MINUS 操作 符 , 差 查询 操作 。 操 作 结 果 为 取 < 查 询 1 > 得 到 的 元 组 ,而 < 查询 2 > 没 
有 的 元 组 。 

@ INTERSECT 操作 符 , 交 查询 操作 。 操 作 结果 为 取 < 查 询 1 > 和 < 查询 2 > 共有 的 元 组 。 

5) 其 他 SQL 操作 符 

其 他 SQL 操作 符 是 针对 SELECT 子 句 中 的 字段 表 设计 的 , 它 用 于 简写 结果 集 的 字段 
表 和 对 字段 值 的 限制 说 明 。 其 他 SQL 操作 符 包括 ** ”ALL 和 DISTINCT 3 种 。 

@“* ”操作 符 。* 为 字段 组 的 省 略 写法 ,说 明 取 表 中 的 全 部 字段 ,使 用 格式 为 * 或 < 表 
名 >. * 。 

@ ALL 操作 符 。ALL 说 明 在 查询 结果 中 保留 重复 值 ,如 果 查 询 中 有 统计 函数 ,ALL 
要 求 计算 重复 值 。ALL 的 使 用 格式 为 : 


ALL < 字段 > 或 ALL < 字段 组 > 


@@ DISTINCT 操作 符 。 去 掉 重复 值 操作 。DISTINCT 和 ALL 相反 , 它 说 明 在 查询 结 
果 集 中 去 掉 重 复 值 ,或 在 统计 函数 中 不 计 重 复 值 。DISTINCT 的 使 用 格式 为 : 


DISTINCT < 字段 > 或 DISTINCT < 字段 组 > 

SQL 的 查询 语句 可 以 分 为 简单 查询 、 连 接 查询 .组 套 查询 和 组 合 查 询 4 种 类 型 。 下 面 
介绍 的 查询 实例 仍 以 学 生 课程 数据 库 为 例 , 来 描述 各 种 查询 的 用 法 。 对 应 关系 表 的 数据 见 
表 3-4 一 表 3-6。 


3.3.2 单 表 查 询 

单 表 查 询 是 指 在 查询 过 程 中 只 涉及 一 个 表 的 查询 语句 。 

1. 选择 表 中 的 若干 列 

1) 查询 指定 的 列 

一 般 情况 下 ,用 户 只 对 表 中 的 部 分 属性 列 感 兴趣 ,这 时 可 以 通过 在 SELECT 子 句 的 < 目 
标 列表 达 式 > 中 指定 要 查询 的 属性 列 。 它 对 应 关系 代数 中 的 投影 运算 。 

【 例 14】 查询 全 体 学 生 的 学 号 和 姓名 。 

SELECT Sno, Sname 

FROM Student; 

解 题 说 明 

该 语句 的 执行 过 程 是 : 从 学 生 表 中 取出 一 个 元 组 ,取出 该 元 组 在 属性 学 号 和 名 字 上 的 
值 ,形成 一 个 新 的 元 组 作为 输出 。 对 学 生 表 中 的 所 有 元 组 作 相同 的 处 理 , 最 后 形成 一 个 结果 
关系 作为 输出 。 

2) 查询 全 部 列 

【 例 15】 若 查 询 学 生 表 中 全 体 学 生 的 情况 , 即 查 整个 表 , 则 可 表示 为 ， 

SELECT * 

FROM Student 


等 价 于 : 


SELECT sno, Sname, Ssex, Sage, Sdept 

FROM Student; 

解 题 说 明 : 

其 中 * 代表 查询 指定 表 的 所 有 列 。 

SQL 对 查询 的 结果 不 会 自动 去 除 重复 行 ,如 果 要 求 删 除 重复 行 ,可 以 使 用 限定 词 
DISTINCT。 若 没 指定 该 限定 词 , 则 默认 为 ALL, 即 保留 查询 结果 的 全 部 值 。 

【 例 16】 查询 所 有 已 被 学 生 选 修 的 课程 的 课程 号 。 

SELECT DISTINCT Cno 

FROM SC; 

解 题 说 明 : 

该 查询 语句 使 用 了 DISTINCT 关键 词 。 由 于 一 门 课程 可 能 被 多 个 学 生 选 用 ,在 选课 表 
中 对 课程 号 进行 投影 后 会 出 现 重 复 的 课程 号 ,而 如 果 使 用 了 DISTINCT 操作 符 后 ,就 可 以 
使 结果 表 中 ,不 出 现 重复 的 课程 号 。 输 出 的 结果 是 : 
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另外 ,如 果 没 有 指定 DISTINCT 关键 词 , 则 缺 省 为 ALL, 即 保留 结果 表 中 取 值 重复 
的 行 。 
3) 查询 经 过 计算 的 值 
SELECT 子 句 的 < 目标 列表 达 式 > 不 仅 可 以 是 表 中 的 属性 列 ,也 可 以 是 算术 表达 式 。 
【 例 17】 查询 全 体 学 生 的 学 号 、 姓 名 及 出 生年 份 
SELECT Sno, Sname, 2017 — Sage 
FROM Student; 
解 题 说 明 : 
该 语句 的 查询 结果 的 第 二 列 是 一 个 数学 表达 式 ,而 不 是 属性 名 。 是 用 当今 的 年 份 (假设 
是 2017 年 ) 减 去 学 生 的 年 龄 , 即 得 出 生年 份 。 输 出 的 结果 是 : 


Sno Sname 2017-Sage 
1703070101 李 艺 1999 
1703070211 王 一 1998 
1703070120 张 欣 1999 
1703070125 吴 波 1998 
1703070302 何 穗 1999 
1701030302 张 恒 2000 
1701030322 赵 冬 1997 
1702030315 张 坦 1998 
1704030302 吴 桐 1999 


另外 ,用 户 可 以 通过 指定 别名 来 改变 查询 结果 的 列 标题 ,这 样 可 以 使 输出 结果 更 直观 。 
这 对 于 含 算术 表达 式 .常量 .函数 名 的 目标 列表 达 式 尤为 有 用 。 例 如 对 于 上 例 , 可 以 定义 如 
下 的 属性 列 别名 : 


SELECT Sno 学 号 , Sname 姓名 ,2017 - Sage 出 生年 月 


FROM Student; 
输出 结果 为 : 

学 号 姓名 出 生年 月 
1703070101 李 艺 1999 
1703070211 王 一 1998 
1703070120 张 欣 1999 
1703070125 吴 波 1998 
1703070302 何 穗 1999 
1701030302 张 恒 2000 
1701030322 赵 冬 1997 
1702030315 张 旭 1998 
1704030302 吴 桐 1999 


2. 选择 表 中 的 若干 元 组 
除了 上 述 的 查询 指定 的 列 以 外 ,还 可 以 查询 满足 条 件 的 元 组 。 查 询 满足 条 件 的 元 组 可 


以 通过 WHERE 子 句 实现 。WHERE 子 句 允许 用 户 确定 一 个 谓词 。 带 有 WHERE 子 句 的 
SELECT 语句 ,输出 结果 只 给 出 使 谓词 为 真 的 那些 元 组 值 。 WHERE 之 后 的 谓词 就 是 查询 
条 件 。 

1) 比较 和 逻辑 运算 

WHERE 之 后 的 查询 条 件 中 允许 出 现 比较 运算 符 : =( 等 于 )、 >( 大 于 ) .> 一 ( 大 于 等 
于 ) ,三 (小 于 ) 二 = (小 于 等 于 ) 二 > (不 等 于 ) 和 逮 辑 运算 符 AND( 与 )、NOT( 非 )、OR 
(或 ) 等 。 

【 例 18】 查询 信息 学 院 全 体 学 生 的 名 单 。 

SELECT Sname 

FROM Student 

WHERE Sdept = ' 信 息 学 院 '; 

解 题 说 明 

在 表达 查询 时 ,首先 要 确定 查询 的 源 表 , 源 表 可 以 为 基本 表 或 视图 。 本 例 的 源 表 是 学 生 
表 ; 表达 查询 的 第 二 步 是 确定 元 组 选择 要 求 和 结果 列 的 表达 。 本 例 的 元 组 选择 条 件 是 所 属 
学 院 等 于 “信息 学 院 ”, 结 果 列 为 学 生 姓名 。 

RDBMS 执行 该 程序 的 一 种 可 能 的 过 程 是 : 对 Student 表 进 行 全 表 扫 描 , 取 出 一 个 元 
组 ,检查 该 元 组 在 Sdept 列 的 值 是 否 等 于 ' 信 息 学 院 ', 若 相等 , 则 取出 Sname 列 的 值 形成 一 
个 新 的 元 组 输出 ,和 否则 跳 过 该 元 组 , 取 下 一 个 元 组 。 重 复 以 上 步骤 。 

但 是 如 果 Student 表 很 大 ,有 成 千 上 万 个 元 组 ,而 信息 学 院 只 占有 全 校 人 数 的 10% 左 
右 , 按 上 述 顺 序 查询 的 方法 将 会 很 浪费 时 间 。 解 决 的 办 法 是 可 以 在 Sdept 列 上 建立 索引 ，, 系 
统 会 利用 该 索引 找 出 Sdept= ' 信 息 学 院 ' 的 元 组 ,从 中 取出 Sname 列 值 形成 结果 表 。 这 样 就 
避免 了 对 Student 表 的 全 表 扫 描 , 加 快 查询 速度 。 

但 需要 注意 的 是 ,如 果 一 个 表 的 元 组 数量 较 少 ,建立 索引 不 一 定 能 提高 查询 效率 ,系统 
仍然 会 使 用 全 表 扫 描 。 这 由 查询 优化 器 某 些 规则 或 估计 执行 代价 来 做 出 选择 。 

【 例 19】 查找 学 分 为 7 的 课程 号 和 课程 名 。 


SELECT Cno, Cname 


FROM Course 
WHERE Ceredit =7; 
输出 结果 为 ， 
Cno Cname 
03001 数据 库 原 理 
03002 计算 机 网 络 


修改 上 例 , 若 需 找 出 学 分 为 7 或 先 修 课 为 03001 的 课程 号 和 课程 名 , 则 可 表示 为 : 


SELECT Cno, Cname 
FROM Course 
WHERE Ccredit = 7 OR Cpno= '03001'; 


输出 结果 为 : 
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Cno Cname 
03001 数据 库 原理 
03002 计算 机 网 络 
03007 信息 系统 


解 题 说 明 : 
该 例 使 用 了 由 辑 运算 符 OR ,表达 了 ”或 ”的 语义 。 
【 例 20】 查询 考试 不 及 格 的 学 生 的 学 号 。 


SELECT DISTINCT Sno 


FROM SC 
WHERE Grade < 60; 
输出 结果 为 
Sno 
1701030302 
1701030322 
解 题 说 明 : 


这 里 使 用 了 DISTINCT 短语 , 当 一 个 学 生 有 多 门 课程 不 及 格 时 ,他 的 学 号 也 只 输出 
一 次 : 

2) 谓 询 BETWEEN( 确 定 范围 7 

谓词 BETWEEN…AND… 是 “包含 于 …… 之 中 ”的 意思 ,用 于 判断 某 值 是 否 属于 一 个 指 
定 的 区 间 。BETWEEN... AND... 可 以 用 来 查找 属性 值 在 指定 范围 的 元 组 ,而 NOT 
BETWEEN...AND... 可 以 用 来 查找 属性 值 不 在 指定 范围 的 元 组 。 其 中 BETWEEN 后 是 范 
围 的 下 限 ( 即 低 值 ),AND 后 是 范围 的 上 限 ( 即 高 值 ) 。 

【 例 21】 查询 年 龄 为 20 一 23 岁 的 学 生 的 姓名 、 系 别 和 年 龄 。 

SELECT Sname, Sdept, Sage 


FROM Student 
WHERE Sage BETWEEN 20 AND 23; 


解 题 说 明 : 

在 元 组 选择 子 句 中 使 用 了 表达 式 BETWEEN...AND. 它 表示 选择 年 龄 为 20 一 23 岁 的 ， 
即 20 寺 Sage23。 

【 例 22】 查询 年 龄 不 为 20 一 23 岁 的 学 生 的 姓名 、 系 别 和 年 龄 。 

SELECT Sname, Sdept, Sage 


FROM Student 
WHERE Sage NOT BETWEEN 20 AND 23; 


解 题 说 明 : 


在 元 组 选择 子 句 中 使 用 了 表达 式 “NOT BETWEEN... AND”, 它 表示 选择 年 龄 不 为 
20 一 23 岁 的 , 即 Sage 二 20 或 者 Sage>23。 


3) 字符 匹配 (LIKE) 
谓词 LIKE 可 以 用 来 进行 字符 串 的 匹配 。 其 一 般 语 法 格式 如 下 : 


[NOT] LIKE '< 匹 配 串 >'[ESCRPE'< 换 码 字符 >'] 


其 含义 是 查找 指定 的 属性 列 值 与 < 匹配 串 > 相 匹 配 的 元 组 。< 匹 配 串 > 可 以 是 一 个 完整 
的 字符 串 ,也 可 以 含有 通配符 % 和 _。 其 中 : 

。 %( 百 分 号 ) 代 表 任 意 长 度 (长 度 可 为 0) 的 字符 串 。 例 如 : a%t 表示 以 a 开头 以 t 结 

尾 的 任意 长 度 的 字符 串 。 如 : at、assist、assistant 等 都 满足 该 匹配 串 。 

。 _-( 下 夯 线 ) 代 表 任意 单个 字符 。 

【 例 23】 查询 所 有 姓 刘 或 姓 王 的 学 生 的 姓名 ,学 号 和 性 别 。 

SELECT Sname，Sno，Ssex 

FROM Student 

WHERE Sname LIKE ' 刘 和 ' OR Sname LIKE ' 王 '; 

解 题 说 明 ， 

使 用 了 LIKE 模式 匹配 表达 式 ,“Sname”LIKE' 刘 %' 和 “Sname”LIKE' 王 %' 表 示 查 询 
姓 * 刘 ”或 姓 " 王 ”的 同学 。 

【 例 24】 查询 名 字 中 第 2 个 字 为 “ 艺 " 字 的 学 生 的 学 号 和 姓名 。 

SELECT Sno, Sname 

FROM Student 

WHERE Sname LIKE' _ 艺 %'; 

解 题 说 明 : 

注意 : 一 个 汉字 占 两 个 字符 位 ,所 以 表示 一 个 汉字 需要 用 两 个 < ”。 

如 果 用 户 要 查询 的 字符 串 本 身 就 含有 % 或 _, 这 时 就 要 使 用 ESCAPE'< 换 码 字符 >' 短 语 
对 通配符 进行 转 义 了 。 

【 例 25】 查询 课程 名 为 DB_Design 的 课程 情况 。 

SELECT * 

FROM Course 

WHERE Cname LIKE 'DB\_ Design' ESCAPE'\'; 

解 题 说 明 : 

@ ESCAPEA' 表 示 “\ "为 换 码 字符 ,这 样 匹 配 串 中 紧 跟 在 \' 后 面 的 字符 “不 再 具有 通 
配 符 的 含义 , 故 它 被 转 义 为 普通 字符 下 横 线 _。 

@ 换 码 字符 是 可 变化 的 ,一 般 取 不 常用 的 符号 。 上 例 中 , 若 匹配 串 中 本 身 含 \', 则 换 码 
字符 可 取 *?”。 

【 例 26】 查找 学 号 为 1703070101 的 学 生 的 详细 情况 。 

SELECT * 


FROM Student 
WHERE Sno LIKE '1703070101'7 


该 查询 语句 等 价 于 : 
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SELECT * 
FROM Student 
WHERE Sno = '1703070101'; 


解 题 说 明 

如 果 LIKE 后 面 的 匹配 串 中 不 含有 通配符 , 则 可 以 用 ==( 等 于 ) 运 算 符 取代 LIKE 谓词 ， 
用 != 或 二 二 (不 等 于 ) 运 算 符 取 代 NOT LIKE 谓词 。 

4) 确定 集合 (谓词 IN) 

谓词 IN 可 以 用 来 查找 列 值 属于 指定 集合 (括号 中 的 值 集 或 某 个 查询 子 句 的 结果 ) 的 元 
组 。 与 IN 相对 的 谓词 是 NOT IN, 用 于 查找 列 值 不 属于 指定 集合 的 元 组 。 

【 例 27】 求 信息 学 院 或 机 械 学 院 姓 张 的 学 生 的 信息 。 

SELECT * 

FROM Student 

WHERE Sdept IN( ' 信 息 学 院 ', "机械 学 院 ')AND Sname LIKE ' 张 名 '; 

解 题 说 明 : 

@ 目标 列 使 用 * ,表示 选择 学 生 表 中 的 所 有 字段 。 

@ 使 用 了 “Sdept IN(' 信 息 学 院 ', ' 机 械 学 院 '") ”操作 表达 式 ,该 表达 式 也 可 用 “Sdept 一 ' 
信息 学 院 'OR Sdept=' 机 械 学 院 '” 来 代替 。 

@ 使 用 了 LIKE 模式 匹配 表达 式 ,“ 姓 名 LIKE' 张 %'” 表 示 查 询 姓 张 的 同学 。 

【 例 28】 查询 学 生 表 中 既 不 是 信息 学 院 , 也 不 是 机 械 学 院 的 学 生 姓名 和 性 别 。 

SELECT Sname, Ssex 


FROM Student 
WHERE ”Sdept NOT IN (' 信 息 学 院 ', ' 机 械 学 院 '); 


解 题 说 明 : 

该 例题 使 用 了 “Sdept NOT IN(' 信 息 学 院 ',' 机 械 学 院 ')” 操 作 表 达 式 ,该 表达 式 也 可 
用 “Sdept <> ' 信 息 学 院 '/AND Sdept 之 ' 机 械 学 院 '" 来 代替 。 

5) 涉及 空 值 的 查询 

【 例 29】 查询 没有 成 绩 的 学 生 的 学 号 和 相应 的 课程 号 。 


SELECT Sno, Cno 
FROM SC 
WHERE Grade IS NULL; 


解 题 说 明 : 

Q@ 这 是 因为 某 些 学 生 选 修 课 程 后 没有 参加 考试 ,所 以 有 选课 记录 ,但 没有 考试 成 绩 。 
@ 该 题 使 用 了 含有 IS NULL 的 操作 表达 式 , 它 表示 成 绩 为 空 的 语义 。 

@ 这 里 的 IS 不 能 用 等 号 (= 一) 来 代 蔡 。 

【 例 30】 查询 所 有 有 成 绩 的 学 生 学 号 和 课程 号 ， 

SELECT Sno，Cno 


FROM SC 
WHERE Grade IS NOT NULL; 


解 题 说 明 : 

该 题 使 用 了 含有 IS NOT NULL 的 操作 表达 式 , 它 表示 成 绩 为 “ 非 空 ”的 语义 。 

6) 多 重 条 件 查 询 

逻辑 运算 符 AND 和 OR 可 用 来 联结 多 个 查询 条 件 。AND 的 优先 级 高 于 OR, 但 可 以 


用 括号 改变 优先 级 。 
【 例 31】 查询 信息 学 院 年 龄 在 20 岁 以 下 的 学 生 姓名 。 
SELECT Sname 
FROM Student 


WHERE Sdept = ' 信 息 学 院 ' AND Sage < 20; 


【 例 32】 查询 选 了 03001 号 课程 且 成 绩 大 于 90 分 的 学 生 号 。 


SELECT Sno 
FROM SC 
WHERE Cno = '03001' AND Grade > 90; 
输出 结果 为 : 
Sno 
1703070211 


3. ORDER BY 子 句 

用 户 可 以 在 ORDER BY 子 句 后 跟 多 个 排序 的 属性 列 名 ,第 一 个 属性 列 为 主 序 , 下 面 依 
次 类 推 。 每 一 个 属性 列 名 后 可 用 限定 词 升序 (ASC) 或 降序 (DESC) 声 明 排序 的 方式 , 缺 省 
为 升序 。 

【 例 33】 查询 选修 了 '03002' 号 课程 的 学 生 的 学 号 及 其 成 绩 ,查询 结果 按 分 数 的 降序 排 
列 , 如 果 成 绩 相 同 , 则 按 学 号 的 升序 排列 。 

SELECT Sno，Grade 

FROM SC 


WHERE Cno = '03002' 
ORDER BY Grade DESC, Sno ASC; 


输出 结 
Sno Grade 
1703070211 85 
1703070101 80 
1703070125 60 
解 题 说 明 : 


使 用 了 排序 子 句 。 其 中 ,成 绩 为 第 一 排序 项 ,学 号 为 第 二 排序 项 。 

注意 : 关于 空 值 在 排序 时 的 次 序 , 即 : 是 排 在 所 有 元 组 的 最 前 面 或 是 最 后 面 ,由 具体 的 
数据 库 管 理 系 统 决 定 。 有 的 管理 系统 规定 ,车 按 升序 排 , 含 空 值 的 元 组 将 最 后 显示 。 若 按 降 
序 排 , 空 值 的 元 组 将 最 先 显 示 。 各 个 系统 的 实现 可 能 不 同 ,只 要 保持 一 致 即 可 。 
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下 面 列 举 一 个 比较 综合 的 例子 。 

【 例 34】 查询 选修 课程 号 '03001' 且 成 绩 为 80 一 90 分 的 学 生 学 号 和 成 绩 ,并 将 成 绩 乘 
以 系数 0. 8 输出 。 

SELECT Sno, Grade * 0.8 


FROM SC 
WHERE Cno = '03001' AND Grade BETWEEN 80 AND 90; 


解 题 说 明 : 

该 题 有 以 下 3 处 值得 注意 : 

Oa 在 目标 列 中 使 用 了 表达 式 : Grade * 0.8。 它 将 结果 集中 的 每 个 成 绩 项 都 乘 以 系数 
0.8; 

@ 在 元 组 选择 子 句 中 使 用 了 谓词 BETWEEN…AND, 它 表示 选择 成 绩 为 80 一 90 分 的 
元 组 。 
@ 在 元 组 子 句 中 使 用 了 AND 操作 符 , 它 表示 两 边 条 件 都 要 成 立 。 

4. 素 集 团 数 (Aggregate Functions) 

为 了 进一步 方便 用 户 ,增强 检索 功能 ,SQL 提供 了 许多 聚集 函数 ,主要 有 : 

COUNT( [DISTINCT| ALL] * ) 统计 元 组 个 数 

COUNT( [DISTINCT|ALL]< 列 名 >) ”统计 一 列 中 值 的 个 数 

SUM([DISTINCT|ALL]< 列 名 >) ”计算 一 列 值 的 总 和 (此 列 必须 是 数值 型 ) 
AVG([DISTINCT|ALL]< 列 名 >) ”计算 一 列 值 的 平均 值 (此 列 必须 是 数值 型 ) 

MAX( [DISTINCT| ALL]< 列 名 >) 求 一 列 值 中 的 最 大 值 

MIX( [DISTINCT| ALL]< 列 名 >) 求 一 列 值 中 的 最 小 值 

说 明 : 如 果 指 定 DISTINCT 短语 , 则 表示 在 计算 时 要 取消 指定 列 中 的 重复 值 。ALL 为 
缺 省 值 ,表示 不 取消 重复 值 。 聚 集 函 数 统计 或 计算 时 一 般 不 统计 空 值 , 即 均 忽 略 空 值 。 

【 例 35】 查询 学 生 总 人 数 。 

SELECT COUNT( * ) 

FROM Student; 

解 题 说 明 : 

该 题 通过 统计 学 生 表 的 元 组 数 求 出 学 生 的 总 数 。 

【 例 36】 查询 选修 了 课程 的 学 生 人 数 。 


SELECT COUNT (DISTINCT Sno) 
FROM SC; 


解 题 说 明 : 

该 查询 在 COUNT 函数 中 用 DISTINCT 短语 。 这 是 因为 一 名 学 生 可 能 选择 一 门 以 上 
的 课程 ,使 用 DISTINCT 短语 可 以 避免 重复 计算 学 生 人 数 。 

【 例 37】 统计 信息 学 院 学 生 的 人 数 和 平均 年 龄 。 

SELECT COUNT( * ),AVG (Sage) 


FROM Student 
WHERE Sdept = ' 信 息 学 院 '; 


解 题 说 明 : 

该 查询 使 用 了 计算 平均 值 函 数 AVG。 

【 例 38】 查询 选修 了 '03001' 号 课程 并 及 格 学 生 的 总 人 数 及 最 高 分 、 最 低 分 。 

SELECT COUNT ( * ), MAX (Grade), MIN (Grade) 

FROM SC 

WHERE Cno= '03001' AND Grade >= 60; 

解 题 说 明 : 

该 查询 使 用 了 统计 函数 COUNT 求 最 大 值 函 数 MAX 和 最 小 值 函数 MIX。 

【 例 39】 查询 1701010701 号 学 生 选 修 课程 的 总 学 分 数 。 

SELECT SUM ( Ccredit) 

FROM SC, Course 

WHERE Sno = '1701010701' AND SC. Cno = Course. Cno; 

解 题 说 明 : 

在 聚集 函数 遇 到 空 值 时 , 除 COUNT(* ) 外 ,都 跳 过 空 值 而 只 处 理 非 空 值 。 

5. GROUP BY 子 句 

GROUP BY 子 句 的 作用 是 将 查询 结果 表 按 某 相同 的 一 列 值 或 多 列 值 来 分 组 。 而 其 目 
的 是 为 了 细 化 聚集 函数 的 作用 对 象 。 如 果 未 对 查询 结果 分 组 ,聚集 函数 将 作用 于 整个 查询 
结果 。 如 上 面 的 例 35 至 例 39。 分 组 后 聚集 函数 将 作用 于 每 个 组 , 即 每 一 组 都 有 一 个 函 
数值 。 

分 组 与 组 筛选 语句 的 一 般 形 式 : 

< SELECT 查询 块 > 

GROUP BY < 列 名 > 

HAVING < 条 件 > 

说 明 : 

@OD GROUP BY 子 句 对 查询 结果 分 组 ,即将 查询 结果 表 按 某 列 (或 多 列 ) 值 分 组 , 值 相 等 
的 为 一 组 ,再 对 每 组 数据 进行 统计 或 计算 等 操作 。GROUP BY 子 句 总 是 跟 在 WHERE 子 
句 之 后 ( 若 WHERE 子 句 缺 省 , 则 跟 在 FROM 子 句 之 后 ) 。 

Q@ HAVING 短语 常用 于 在 计算 出 聚集 函数 值 之 后 对 查询 结果 进行 控制 ,在 各 分 组 中 
选择 满足 条 件 的 小 组 予以 输出 , 即 进行 小 组 筛选 。 

HAVING 短语 与 WHERE 子 句 是 不 同 的 。 区 别 在 于 HAVING 短语 是 在 各 组 中 选择 
满足 条 件 的 小 组 ; 而 WHERE 子 句 是 在 表 或 视图 中 选择 满足 条 件 的 元 组 。 

【 例 40】 求 每 个 学 院 的 学 生 人 数 。 

SELECT Sdept,COUNT(Sno) 

FROM Student 

GROUP BY Sdept; 

解 题 说 明 : 

Q@ 该 题 的 查询 过 程 分 两 步 , 先 按 所 属 学 院 将 学 生 元 组 进行 分 组 , 即 同 一 学 院 的 学 生 元 
组 分 在 同一 组 中 ; 再 求 出 组 内 的 学 号 总 数 , 即 同一 学 院 学 生 的 人 数 。 
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@ 如 果 该 题 中 无 GROUP BY 子 句 , 则 COUNT(Sno) 的 结果 为 全 部 记录 的 学 号 数 。 
【 例 41】 按 学 号 求 出 每 个 学 生 所 选课 程 的 平均 成 绩 (基于 表 3-6 学 生 选 课 关 系 SC 示 
例 数据 )。 


SELECT Sno, AVG(Grade) 


FROM SC 

GROUP BY Sno; 

最 终 分 组 情况 如 下 所 示 : 

Sno AVG(Grade) 

1703070101 82 
1703070211 85 
1703070125 70 
1701030302 69 
1701030322 45 


若 将 上 例 平 均 成 绩 超过 80 分 的 学 生 输 出 , 则 只 需 在 GROUP BY 子 句 后 加 HAVING 
短语 即 可 : 

SELECT Sno, AVG(Grade) 

FROM SC 


GROUP BY Sno 
HAVING AVG(Grade)> 80; 


解 题 说 明 ， 

本 例 使 用 了 HAVING 子 句 ,其 语义 为 取 组 内 平均 成 绩 大 于 80 分 的 元 组 。HAVING 
子 句 的 内 容 为 组 选择 条 件 , 其 子 句 的 条 件 必 须 有 SQL 函数 。 换 句 话 讲 , 如 果 条 件 中 有 SQL 
函数 ,必须 放 在 HAVING 子 句 中 , 且 HAVING 子 句 跟 在 GROUP BY 子 句 的 后 面 。 该 例 
题 不 能 用 下 面 的 方法 表示 : 

SELECT Sno, AVG( Grade) 

FROM SC 

WHERE AVG(Grade)> 80 

GROUP BY Sno; 

【 例 42】 求学 生 关系 中 女生 的 每 一 年 龄 组 (超过 20 人 ) 有 多 少 ,要 求 查询 结果 按 人 数 
升序 排列 ,人 数 相 同时 按 年 龄 降序 排列 。 

SELECT Sage, COUNT(Sno) 

FROM Student 

WHERE Ssex= ' 女 ' 

GROUP BY Sage 


HAVING COUNT( Sno)> 20 
ORDER BY COUNT( Sno), Sage DESC; 


解 题 说 明 : 
该 题 的 查询 过 程 分 四 步 : 


@ 先 使 用 WHERE 子 句 选 出 性 别 为 女生 的 元 组 , 即 Ssex 二 ' 女 '; 

@ 其 次 按 年 龄 将 女生 元 组 进行 分 组 , 即 年 龄 相同 的 女 学 生 元 组 分 在 一 组 中 ; 
@ 然后 求 出 组 内 的 学 号 数 , 即 年 龄 相同 的 女 学 生 且 超过 20 人 的 学 生 数 ; 

@ 最 后 结果 按 要 求 排序 。 


3.3.3 连接 查询 (多 表 查 询 ) 


前 面 的 查询 都 是 针对 一 个 表 进 行 的 。 若 一 个 查询 同时 涉及 两 个 或 两 个 以 上 的 表 , 这 时 
查询 需要 包括 连接 操作 的 查询 语句 , 则 这 样 的 查询 称 为 连接 查询 。 连 接 查 询 是 关系 数据 库 
中 最 主要 的 查询 ,包括 等 值 连接 、 非 等 值 连接 、 自 然 连 接 、 求 笛 卡 儿 积 、 一 般 连接 、 外 连接 、 内 
连接 、 左 连接 和 右 连 接 等 多 种 。 由 于 连接 查询 涉及 被 连接 和 连接 两 个 表 , 所 以 它 的 源 表 一 般 
为 多 表 。 连 接 查询 中 的 连接 条 件 通 过 WHERE 子 句 表达 ,连接 条 件 和 元 组 选择 条 件 之 间 用 
AND( 与 ) 操 作 符 衔接 。 

1. 等 值 连接 与 非 等 值 连接 查询 

连接 查询 中 WHERE 子 句 用 来 连接 两 个 表 的 条 件 称 为 连接 条 件 或 连接 谓词 ,一般 格 

[< 表 名 1 >. ]< 列 名 1>< 比 较 运 算 符 >[< 表 名 2>. ]< 列 名 2> 


其 中 ,比较 运算 符 主要 有 一、>、 <<、 > 一 、 雪 = 一、 和 != (或 <>) 等 。 
此 外 连接 谓词 还 可 以 使 用 如 下 形式 : 


[< 表 名 1>. ]< 列 名 1 > BETWEEN [< 表 名 2>. ]< 列 名 2> AND[< 表 名 2>. ]< 列 名 3> 


连接 谓词 中 的 列 名 称 为 连接 字段 。 连 接 条 件 中 ,连接 字段 类 型 必须 是 可 比 的 ,但 连接 字 
段 不 一 定 是 同名 的 。 

当 连 接 运 算 符 为 一” 时 ,该 连接 操作 称 为 等 值 连接 ; 否则 ,使 用 其 他 运算 符 的 连接 运算 
称 为 非 等 值 连接 。 当 等 值 连接 中 的 连接 字段 相同 ,并 且 在 SELECT 子 句 中 去 除了 重复 字段 
时 , 则 该 连接 操作 为 自然 连接 。 

【 例 43】 查询 每 个 学 生 及 其 选修 课程 的 情况 。 

分 析 : 学 生 情 况 存 放 在 Student 表 中 、 学 生 选 课 情况 存放 在 SC 表 中 ,所 以 本 查询 实际 
上 涉及 Student 与 SC 两 个 表 。 这 两 个 表 之 间 的 联系 是 通过 公共 属性 Sno 实现 的 。 实 现 语 
名 如下: 

SELECT Student. x ,SC. * 


FROM Student, SC 
WHERE Student. Sno = SC. Sno; 


解 题 说 明 : 

@ 将 Student 与 SC 中 同一 学 生 的 元 组 连接 起 来 。 

@ 该 题 的 目标 列 中 含 学 生 表 的 全 部 属性 和 选课 表 的 全 部 属性 。 

@ 由 于 目标 列 中 有 “学 生 . 学 号 ”和 “选课 .学 号 ”两 个 相同 的 属性 名 的 属性 , 故 它 的 连接 
操作 是 等 值 连接 。 如 果 在 SELECT 子 名 中 将 重复 属性 去 掉 , 则 该 操作 即 为 自然 连接 操作 。 

@ 连接 操作 的 连接 条 件 必须 在 WHERE 子 句 中 写 出 。 如 果 使 用 了 两 个 表 查 询 , 但 
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WHERE 子 句 中 无 连接 条 件 , 则 结果 为 广义 稍 积 操作 结果 。 
假设 Student 表 、SC 表 的 数据 如 表 3-4 及 表 3-6 所 示 ,该 查询 的 执行 结果 如 下 所 示 : 


Student. Sno Sname Sage Ssex Sdept SC. Sno Cno Grade 
1703070101 李 艺 18 女 信息 学 院 1703070101 03001 76 
1703070101 李 艺 18 女 信息 学 院 1703070101 03002 80 
1703070101 李 艺 18 女 信息 学 院 1703070101 03003 90 
1703070211 王 一 19 男 信息 学 院 1703070211 03001 90 
1703070211 王 一 19 男 信息 学 院 1703070211 03002 85 
1703070211 王 一 19 男 信息 学 院 1703070211 03003 80 
1703070125 吴 波 19 男 信息 学 院 1703070125 03002 60 
1703070125 吴 波 19 男 信息 学 院 1703070125 03004 80 
1701030302 张 恒 17 女 机 械 学 院 1701030302 03003 84 
1701030302 张 恒 17 女 机 械 学 院 1701030302 03006 54 
1701030322 赵 冬 20 男 机 械 学 院 1701030322 03006 33 
1701030322 赵 冬 20 男 机 械 学 院 1701030322 03001 57 


注意 : 本 例 中 ,SELECT 子 句 与 WHERE 子 句 中 的 属性 名 前 都 加 上 了 表 名 前 级 ,这 是 
为 了 避免 混淆 。 如 果 属 性 名 在 参加 连接 的 各 表 中 是 唯一 的 , 则 可 以 省 略 表 名 前 缓 。 

RDBMS 执行 该 连接 操作 的 一 种 可 能 过 程 是 : 

先 在 表 Student 中 找到 第 一 个 元 组 ,然后 从 头 开始 扫描 SC 表 , 逐 一 查找 与 Student 第 
一 个 元 组 的 Sno 相等 的 SC 元 组 ,找到 后 就 将 Student 中 的 第 一 个 元 组 与 该 元 组 拼接 起 来 ， 
形成 结果 表 中 一 个 元 组 。SC 全 部 查找 完 后 ,再 找 Student 中 第 二 个 元 组 ,然后 再 从 头 开 始 
扫描 SC ,逐一 查找 满足 连接 条 件 的 元 组 ,找到 后 就 将 Student 中 的 第 二 个 元 组 与 该 元 组 拼 
接 起 来 ,形成 结果 其 中 一 个 元 祖 。 重 复 上 述 操作 ,直到 Student 中 的 全 部 元 组 都 处 理 完毕 为 
止 。 这 就 是 嵌 套 循环 算法 的 基本 思想 。 

如 果 在 SC 表 Sno 上 建立 了 索引 的 话 ,就 不 用 每 次 全 表 扫描 SC 表 了 ,而 是 根据 Sno 值 
通过 索引 找到 相应 的 SC 元 组 。 用 索引 查询 SC 中 满足 条 件 的 元 组 一 般 会 比 全 表 扫 描 快 。 

若 在 等 值 连接 中 把 目标 列 中 重复 的 属性 列 去 掉 则 为 自然 连接 。 

上 例如 果 用 自然 连接 完成 , 则 查询 表达 为 : 

【 例 44】 


SELECT Student. Sno, Sname, Ssex,Sage, Sdept, Cno, Grade 
FROM Student, SC 
WHERE Student. Sno = SC. Sno; 


解 题 说 明 : 

在 描述 字段 时 ,如 果 源 表 中 有 重复 字段 ,需要 用 “< 表 名 >. < 字段 名 >” 说 明 , 即 在 字段 前 
加 表 名 限定 。 对 于 不 重复 的 字段 ,可 直接 写字 段 名 。 

该 例 中 ,由 于 Sname,Ssex,Sage,Sdept,Cno 和 Grade 属性 列 在 Student 表 与 SC 表 中 
是 唯一 的 ,因此 引用 时 可 以 去 掉 表 名 前 级 。 而 Sno 在 两 个 表 中 都 出 现 了 ,因此 引用 时 必须 
加 上 表 名 前 缀 。 


【 例 45】 求 选修 课程 号 为 '03001' 且 成 绩 为 90 分 以 上 的 学 生 学 号 、 姓 名 及 成 绩 。 


SELECT Student. Sno, Sname, Grade 
FROM Student, SC 
WHERE Student. Sno = SC. Sno AND Cno = '03001'AND Grade>90; 


解 题 说 明 : 

该 查询 的 一 种 优化 (或 更 高 效 ) 的 执行 过 程 是 先 从 SC 表 中 挑选 出 Cno= '03001 ' 且 
Grade 二 90 的 元 组 形成 一 个 中 间 关 系 , 再 和 Student 表 中 满足 条 件 的 元 组 进行 连接 得 到 最 
终结 果 。 

连接 操作 除了 可 以 是 两 表 连 接 , 一 个 表 的 自身 连接 ,还 可 以 是 两 个 以 上 的 表 进 行 连接 ， 
后 者 通常 称 为 多 表 连 接 。 

下 面 列举 一 个 多 表 连 接 的 例子 ,介绍 自身 连接 操作 。 

【 例 46】 求学 生 的 学 号 、 姓 名 、 选 修 的 课程 名 及 成 绩 。 

SELECT Student. Sno, Sname, Cname, Grade 

FROM Student, SC, Course 

WHERE Student. Sno = SC. Sno AND SC. Cno= Course.Cno; 

解 题 说 明 : 

在 例 43 的 连接 查询 中 ,WHERE 子 句 中 只 有 一 个 条 件 , 即 连接 谓词 。 而 本 题 的 查询 涉 
及 3 个 表 , 在 WHERE 子 句 中 用 AND 将 两 个 连接 条 件 结合 ,从 而 实现 了 3 个 表 连 接 在 一 起 
的 操作 。 即 在 WHERE 子 句 中 可 以 有 多 个 连接 条 件 , 称 为 复合 条 件 连接 。 

2. 自身 连接 操作 

连接 操作 不 只 是 在 两 个 表 之 同 进行 ,一 个 表 内 也 可 以 进行 自身 连接 操作 。 

【 例 47】 查询 每 一 门 课 的 间接 先行 课 ( 即 先行 课 的 先行 课 ) 。 

分 析 : 在 Course 表 中 ,只 有 每 门 课 的 直接 先行 课 信息 , 先 性 课 是 在 之 前 的 学 期 应 开设 
的 ,而 先行 课 的 先行 课 ( 即 间接 先行 课 ) 应 该 至 少 提前 一 学 年 开设 ,但 在 Course 表 中 并 没有 
先行 课 的 先行 课 的 信息 。 要 得 到 这 个 信息 ,必须 先 对 一 门 课 找到 其 先行 课 , 再 按 此 先行 课 的 
课程 号 ,查找 它 的 先行 课程 。 这 就 需要 对 Course 表 进 行 自身 连接 。 该 例 参照 表 3-5 中 
Course 表 的 数据 。 

如 果 查 询 某 门 课 的 间接 先行 课 或 全 部 课程 的 间接 先行 课 , 由 Course 表 的 数据 可 以 推出 
课程 的 间接 关系 链 为 : 03007 一 03001 一 03005 一 03003 一 03006。 从 间接 关系 链 得 出 ,要 开 信 
息 系 统 , 在 前 一 学 期 应 开设 数据 库 原 理 课 ,而 前 两 学 期 应 开设 数据 结构 课 。 

为 此 ,要 为 Course 表 取 两 个 别名 ,一 个 是 FIRST, 另 一 个 是 SECOND( 这 是 两 个 结果 和 
内 容 完 全 相同 的 两 个 表 ) 。 

完成 该 查询 的 SQL 语句 为 : 

SELECT FIRST. Cno, SECOND. Cpno 

FROM Course FIRST, Course SECOND 

WHERE FIRST. Cpno= SECOND. Cno; 

解 题 说 明 : 

@ 在 同一 查询 语句 中 , 当 一 个 表 有 两 个 不 同 的 功能 时 ,需要 对 表 起 别名 ,应 用 时 使 用 表 
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的 别名 。 本 例 中 FRIST 和 SECOND 分 别 是 Course 表 的 别名 ,FRIST 和 SECOND 分 别 作 
为 独立 的 表 使 用 。 

@ 该 题 的 连接 条 件 是 FRIST 表 中 的 先行 课 与 SECOND 表 中 的 课程 号 作 等 值 连接 , 结 
果 集 中 “SECOND. Cpno” 为 “FIRST. Cno” 的 间接 先行 课 。 由 于 FRIST 与 SECOND 都 是 
课程 表 的 别名 ,该 例 是 自身 连接 操作 。 

@ 数据 库 系 统 在 执行 该 例 的 操作 时 ,首先 按 别 名 形成 两 个 独立 的 课程 表 FRIST 和 
SECOND, 然 后 根据 要 求 连接 成 结果 表 。 


操作 的 结果 集 如 下 所 示 : 
FIRST. Cno SECOND. Cpno 
03001 03003 
03002 03006 
03005 03006 
03007 03005 


再 看 一 个 自身 连接 的 例子 。 

【 例 48】 找 出 年 龄 比 * 李 艺 " 同 学 大 的 学 生 的 姓名 及 年 龄 。 

SELECT S1. Sname,S1. Sage 

FROM Student S1, Student S2 

WHERE S1. Sage > S2. Sage AND S2. Sname = ' 李 艺 '; 

3. 外 连接 

在 前 面 的 连接 示例 中 ,只 有 满足 连接 条 件 的 元 组 才能 作为 结果 输出 。 排 除了 两 个 表 中 
没有 对 应 的 或 匹配 的 元 组 情况 ,这 种 连接 称 为 内 连接 。 如 例 43 的 结果 表 中 没有 
“1703070120”“1703070302”“1702030315” 和 ”1704030302” 这 四 位 学 生 的 信息 ,原因 在 
于 他 们 没有 选课 ,在 SC 表 中 没有 相应 的 匹配 元 组 ,造成 Student 中 这 些 元 组 在 连接 时 被 
舍弃 了 。 

如 果 要 求 查询 结果 集中 保留 非 匹 配 的 元 组 ,例如 想 以 Student 表 为 主体 列 出 每 个 学 生 
的 基本 情况 及 其 选课 情况 。 若 某 个 学 生 没 有 选课 , 仍 把 舍弃 的 Student 元 组 保存 在 结果 关 
系 中 ,而 在 SC 表 的 属性 上 填空 值 (Null) ,这 时 就 要 执行 外 部 连接 操作 ,外 连接 的 概念 已 经 
在 专门 的 关系 运算 (2.4. 2 节 ) 中 讲解 过 。 

可 以 如 下 改写 例 44, 见 例 49 。 

【 例 49】 


SELECT Student. Sno, Sname, Ssex, Sage, Sdept, Cno, Grade 
FROM Student LEFT OUTER JOIN SC ON( Student. Sno = SC. Sno); 


也 可 以 使 用 USING 来 去 掉 结 果 中 的 重复 值 : 


FROM Student LEFT OUT JOIN SC USING (Sno) ; 

SQL 的 外 部 连接 分 左 外 部 连接 和 右 外 部 连接 两 种 。 左 外 部 连接 操作 是 在 结果 集中 保 
留连 接 表 达 式 左边 关系 中 (如 本 例 的 Student) 的 非 匹配 记录 , 右 外 部 连接 操作 是 在 结果 集 
中 保留 连接 表达 式 右边 关系 中 的 非 匹 配 记录 。 


输出 结果 为 : 


Student. Sno Sname Sage Ssex Sdept Cno Grade 
1703070101 李 艺 18 女 信息 学 院 03001 76 
1703070101 李 艺 18 女 信息 学 院 03002 80 
1703070101 李 艺 18 女 信息 学 院 03003 90 
1703070211 王 一 19 男 信息 学 院 03001 90 
1703070211 王 一 19 男 信息 学 院 03002 85 
1703070211 王 一 19 男 信息 学 院 03003 80 
1703070125 吴 波 19 男 信息 学 院 03002 60 
1703070125 吴 波 19 男 信息 学 院 03004 80 
1701030302 张 恒 17 女 机 械 学 院 03003 84 
1701030302 张 恒 17 女 机 械 学 院 03006 54 
1701030322 赵 冬 20 男 机 械 学 院 03006 33 
1701030322 赵 冬 20 男 机 械 学 院 03001 57 
1703070120 张 欣 18 男 信息 学 院 NULL NULL 
1703070302 何 穗 18 女 信息 学 院 NULL NULL 
1702030315 张 坦 19 男 汽车 学 院 NULL NULL 
1704030302 吴 桐 18 女 经 贸 学 院 NULL NULL 


要 注意 的 是 ,有 的 DBMS 的 外 连接 可 能 有 如 下 表示 : 左 外 部 连接 符号 为 "* 一”, 右 外 
部 连接 符号 为 "二 *”。 外 部 链接 不 匹配 的 分 量 用 NULL 表示 。 


3.3.4 谋 厦 查询 


在 SQL 语言 中 ,一 个 SELECT-FROM-WHERE 语句 称 为 一 个 查询 块 。 将 一 个 查询 快 
嵌 套 在 另 一 个 查询 块 的 WHERE 子 句 或 HAVING 短语 的 条 件 中 的 查询 称 为 子 查询 。 即 在 
WHERE 子 句 或 HAVING 短语 的 条 件 中 可 以 包含 另 一 个 称 为 子 查 询 的 查询 。 采 用 子 查询 
的 查询 又 称 为 租 套 查询 (Nested Query) 。 

查询 过 程 一 般 是 由 里 向 外 进行 处 理 。 即 每 个 子 查询 在 上 一 级 查询 处 理 之 前 求解 , 子 查 
询 的 结果 用 于 建立 其 父 查 询 的 查找 条 件 。 有 具体 实现 为 : SELECT 语句 中 先 用 子 查询 查 出 某 
个 ( 些 ) 表 的 值 , 主 查询 根据 这 些 值 再 去 查 另 一 个 ( 些 ) 表 的 内 容 。 子 查询 总 是 括 在 圆 括号 中 ， 
作为 表达 式 的 可 选 部 分 出 现在 条 件 比 较 运 算 符 的 右边 ,有 选择 地 跟 在 IN、ANY (SOME)、 
ALL 和 EXIST 等 谓词 后 面 。 例 如 : 


SELECT Sname /* 外 层 查 询 或 父 查询 * / 
FROM Student 
WHERE Sage> 

(SELECT AVG(Sage ) /* 内 层 查 询 或 子 查询 * / 


FROM Student) ; 


本 例 中 ,下 层 查 询 块 SELECT AVG (Sage) FROM Student 是 嵌 套 在 上 层 查询 
SELECT Sname FROM Student WHERE Sage > 的 WHERE 条 件 中 的 。 上 层 的 查询 块 称 
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为 外 层 查 询 或 父 查询 ,下 层 查询 块 称 为 内 层 查询 或 子 查询 。 

SQL 语言 允许 多 层 嵌 套 查询 。 即 一 个 子 查询 中 还 可 以 嵌 套 其 他 子 查询 。 多 层 骨 套 
查询 使 得 可 以 用 多 个 简单 查询 构成 复杂 的 查询 ,从 而 增强 SQL 的 查询 能 力 。 以 层 层 嵌 套 
的 方式 来 构造 程序 正 是 SQL 语言 “结构 化 ”的 含义 所 在 。 需 要 特别 强调 的 是 , 子 查询 的 
SELECT 语句 不 能 使 用 ORDER BY 子 句 。 因 为 ORDER BY 子 句 只 能 对 最 终 查询 结果 
排序 。 

1. 带 有 比较 运算 符 的 子 查询 

带 有 比较 运算 符 的 子 查询 是 指 父 查询 与 子 查 询 之 间 用 比较 运算 符 进行 连接 。 当 用 户 能 
确切 知道 内 层 查询 返回 的 是 单 值 时 ,因此 可 以 用 二 所、 一、 一 、 二 一、 二 > 或 ! 一 等 比较 运 
算 符 。 

【 例 50】 查询 与 “ 李 艺 ”年龄 相同 的 学 生 的 学 号 和 姓名 。 

SELECT Sno, Sname 

FROM Student 

WHERE Sage = (SELECT Sage 

FROM Student 
WHERE Sname = ' 李 艺 '); 


需要 注意 的 是 ,在 有 的 DBMS 中 , 子 查 询 一 定 要 跟 在 比较 符 之 后 ,例如 下 列 写法 是 错 


SELECT Sno, Sname 
FROM Student 
WHERE (SELECT Sage 
FROM Student 
WHERE Sname = ' 李 艺 ') = Sage; 
但 在 SQL SERVER 2014 允许 这 样 的 表示 。 
2. 带 有 IN 谓词 的 子 查询 
在 嵌 套 查询 中 , 子 查 询 的 结果 往往 是 一 个 集合 ,所 以 谓词 IN 是 嵌 套 查询 中 最 经 常 使 用 
的 谓词 。 
【 例 51】 查询 与 “ 李 艺 ”在 同一 个 学 院 学 习 的 学 生 。 
先 分 步 来 完成 此 查询 ,然后 再 构造 嵌 套 查询 。 
@ 确定 * 李 艺 ? 所 属 学院 
SELECT Sdept 


FROM Student 
WHERE Sname = ' 李 艺 '; 


结果 为 : 
信息 学 院 
@ 查找 所 有 在 信息 学 院 学 习 的 学 生 。 


SELECT Sno, Sname, Sdept 
FROM Student 


WHERE Sdept = ' 信 息 学 院 '， 


输出 结果 为 : 

学 号 姓名 所 属 学 院 
1703070101 李 艺 信息 学 院 
1703070211 王 一 信息 学 院 
1703070120 张 欣 信息 学 院 
1703070125 吴 波 信息 学 院 
1703070302 何 穗 信息 学 院 


将 第 一 步 查 询 嵌入 到 第 二 步 查 询 的 条 件 中 ,构造 举 套 查询 如 下 : 


SELECT Sno, Sname, Sdept 
FROM Student 
WHERE Sdept IN 
(SELECT Sdept 
FROM Student 
WHERE Sname = ' 李 艺 '); 
本 例 中 , 子 查询 的 查询 条 件 不 依赖 于 父 查询 , 称 为 不 相关 子 查询 。 一 种 求解 方法 是 由 里 
向 外 处 理 , 即 先 执行 子 查询 , 子 查询 的 结果 用 于 建立 其 父 查 询 的 查找 条 件 。 得 到 如 下 的 
语句 : 
SELECT Sno，Sname，Sdept 
FROM Student 
WHERE Sdept IN( ' 信 息 学 院 '); 
然后 执行 该 语句 。 
本 例 中 的 查询 也 可 以 用 自身 连接 来 完成 ， 
SELECT FIRST. Sno,FIRST. Sname,FIRST. Sdept 


FROM Student FIRST, Student SECOND 
WHERE FIRST. Sdept = SECOND. Sdept AND SECOND. Sname= ' 李 艺 '; 


可 见 ,实现 同一 个 查询 可 以 有 多 种 方法 ,当然 不 同 的 方法 其 执行 效率 可 能 会 有 差别 ,其 
至 会 差别 很 大 。 这 就 是 数据 库 编 程 人 员 应 该 掌握 的 数据 库 性 能 调 优 技术 ,有 兴趣 的 读者 可 
以 参考 相关 文献 资料 ,包括 具体 产品 的 性 能 调 优 方法 。 

【 例 52】 查询 选修 了 课程 名 为 “数据 库 原 理 ” 的 学 生 学 号 和 姓名 。 

本 查询 涉及 学 号 、 姓 名 和 课程 名 3 个 属性 。 学 号 和 姓名 存放 在 Student 表 中 ,课程 名 存 
放 在 Course 表 中 ,但 Student 与 Course 两 个 表 之 间 没 有 直接 联系 ,必须 通过 SC 表 建 立 它 
们 二 者 之 间 的 联系 。 所 以 本 查询 实际 上 涉及 3 个 表 。 


SELECT Sno, Sname 


FROM Student /* 最 后 在 Student 关系 中 取出 Sno 和 Sname * / 
WHERE Sno IN 
( SELECT Sno /* 然后 在 SC 关系 中 找 出 选修 了 3 号 课程 的 学 生 学 号 * / 
FROM SC 
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WHERE Cno IN 

(SELECT Cno 

FROM Course 

WHERE Cname = ' 数 据 库 原理 ') 
); 


本 例 有 更 简单 的 实现 方法 : 


SELECT Student. Sno, Sname 

FROM Student, SC, Course 

WHERE Student. Sno= SC. Sno AND 

SC. Cno= Course. Cno AND 
Course. Cname = ' 数 据 库 原理 '; 

从 以 上 的 例子 可 以 看 到 ,查询 涉及 多 个 关系 时 ,用 典 套 查询 逐步 求解 ,层次 清楚 ,易于 构 
造 ,具有 结构 化 程序 设计 的 优点 。 

有 些 嵌 套 查 询 可 以 用 连接 运算 蔡 代 ,有 些 是 不 能 代替 的 。 对 于 可 以 用 连接 运算 代替 的 
幅 套 查询 ,到 底 采 用 哪 种 方法 用 户 可 以 根据 自己 的 习惯 确定 。 

例 50 一 例 52 中 子 查 询 的 查询 条 件 不 依赖 于 父 查 询 , 这 类 查询 称 为 不 相关 子 查 询 。 不 
相关 子 查询 是 较 简单 的 一 类 子 查询 。 如 果子 查询 的 条 件 依赖 外 层 父 查询 的 某 个 列 值 , 即 当 
一 个 子 查询 的 判断 条 件 涉及 一 个 来 自 外 部 查询 的 列 时 ,这 类 子 查询 称 为 相关 子 查询 
(Correlated Subquerynested Query) ,整个 查询 语句 称 为 相关 嵌 套 查询 (Correlated Nested 
Query) 语 句 。 相 关子 查询 要 用 到 存在 谓词 EXISTS 和 NOT EXIST, 或 者 ALL、ANY 等 。 

3. 带 有 ANY(SOME) 或 ALL 谓词 的 子 查询 

子 查 外 返回 单 值 可 以 用 比较 运算 符 ,但 返回 多 值 时 要 用 ANY( 有 的 系统 用 SOME) ,或 
ALL 谓词 。 谓 词 ANY(SOME) 的 语义 是 指 : 某 些 值 ; ALL 的 语义 是 指 : 所 有 值 。 而 使 用 
ANY 或 ALL 谓词 时 则 必须 同时 使 用 比较 运算 符 。 谓 词 ALL、ANY(SOME) 使 用 的 一 般 格 
式 为 : 


< 列 名 >< 比 较 运算 符 > ALL| ANY( 子 查询 ) 
其 语义 为 : 


> ANY 大 于 子 查 询 结 果 中 的 某 个 值 , 即 表示 大 于 查询 结果 中 的 最 小 值 

> ALL 大 于 子 查询 结果 中 的 所 有 值 , 即 表示 大 于 查询 结果 中 的 最 大 值 

< ANY 小 于 子 查询 结果 中 的 某 个 值 , 即 表示 小 于 查询 结果 中 的 最 大 值 

< ALL 小 于 子 查询 结果 中 的 所 有 值 , 即 表示 小 于 查询 结果 中 的 最 小 值 

>= MNY 大 于 等 于 子 查询 结果 中 的 某 个 值 , 即 表示 大 于 等 于 查询 结果 中 的 最 小 值 
>= ALL 大 于 等 于 子 查询 结果 中 的 所 有 值 , 即 表示 大 于 等 于 查询 结果 中 的 最 大 值 
<= RNY 小 于 等 于 子 查询 结果 中 的 某 个 值 , 即 表 示 小 于 等 于 查询 结果 中 的 最 大 值 
<= ALL 小 于 等 于 子 查询 结果 中 的 所 有 值 , 即 表示 小 于 等 于 查询 结果 中 的 最 小 值 
= ANY 等 于 子 查询 结果 中 的 某 个 值 , 即 相当 于 IN 

= ALL 等 于 子 查询 结果 中 的 所 有 值 (通常 没有 实际 意义 ) 

上 = (或 <>)ANY 不 等 于 子 查询 结果 中 的 某 个 值 

上 = (或 <>)aLL 不 等 于 子 查询 结果 中 的 任何 一 个 值 ,等 价 于 NOT IN。 

此 外 ,= SOME 等 价 于 IN。 


【 例 53】 找 出 平均 成 绩 最 高 的 学 生 号 。 


SELECT Sno 

FROM SC 

GROUP BY Sno 

HAVING AVG (Grade) > = ALL 
(SELECT AVG (Grade) 

FROM SC 

GROUP BY Sno); 


解 题 说 明 : 

@ 该 查询 在 处 理 时 ,首先 处 理子 查询 , 找 出 每 个 的 学 生平 均 成 绩 ,构成 一 个 集合 ; 然后 
处 理 父 查询 , 找 出 平均 成 绩 大 于 集合 中 所 有 值 的 学 生 的 学 号 。 

@ 该 例 的 子 查询 骨 套 在 HAVING 选择 条 件 中 ,并 在 父 查询 和 子 查询 中 都 使 用 了 分 组 
子 句 。 

【 例 54】 找 出 有 一 门 选课 成 绩 在 90 分 以 上 的 学 生 的 姓名 。 

SELECT Sname 

FROM Student 

WHERE Sno IN 

(SELECT DISTINCT Sno 


FROM SC 
WHERE grade > = 90); 


例 54 另 一 种 解法 : 


SELECT Sname 

FROM ”Student 

WHERE Sno= ANY 
(SELECT DISTINCT Sno 
FROM SC 

WHERE grade> = 90); 


解 题 说 明 ， 

谓词 IN 的 含义 是 ,对 于 表 Student 中 的 记录 ,只 有 当 它 的 Sno 在 子 查询 返回 的 Sno 在 
集合 中 时 ,WHERE 子 句 的 值 才 为 真 。 谓 词 ANY 的 含义 是 ,如 果 所 规定 的 运算 符 ( 这 里 是 =) 
对 于 子 查询 返回 的 结果 集合 中 的 某 一 个 值 为 真 的 话 , WHERE 子 句 的 值 就 为 真 。 

【 例 55】 查询 其 他 学 院 中 比 信息 学 院 某 一 学 生年 龄 小 的 学 生 姓名 和 年 龄 。 


SELECT Sname, Sage, Sdept 


FROM Student 
WHERE Sage < ANY ( SELECT Sage 
FROM Student 
WHERE Sdept = ' 信 息 学 院 ') 
AND Sdept <>' 信 息 学 院 '; /* 注意 这 是 父 查 询 块 中 的 条 件 */ 
解 题 说 明 : 


@ 该 查询 在 处 理 时 ,首先 处 理子 查询 , 找 出 信息 学 院 的 学 生年 龄 ,构成 一 个 集合 ; 然后 
处 理 父 查询 , 找 出 年 龄 小 于 集合 中 的 某 一 值 且 不 在 信息 学 院 的 学 生 。 
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@ 该 例 的 子 查询 嵌 套 在 WHERE 选择 条 件 中 , 子 查询 后 又 有 “Sdept <>' 信 息 学 院 '” 选 
择 条 件 。SQL 中 允许 表达 式 中 嵌入 查询 语句 。 

RDBMS 执行 此 查询 时 ,首先 处 理子 查询 , 找 出 信息 学 院 中 所 有 学 生 的 年 龄 ,构成 一 个 
集合 (18,19)。 然 后 处 理 父 查询 , 找 出 不 是 信息 学 院 且 年 龄 小 于 19 岁 或 18 岁 的 学 生 。 输 出 


Sname Sage Sdept 
张 恒 17 机 械 学 院 
吴 桐 18 经 贸 学 院 


本 查询 也 可 以 用 聚集 函数 来 实现 。 首 先 用 子 查询 找 出 信息 学 院 中 最 大 年 龄 (19) ,然后 
查询 所 有 非 信 息 学 院 且 年 龄 小 于 19 岁 的 学 生 。SQL 语句 如 下 : 


SELECT Sname, Sage, Sdept 
FROM Student 
WHERE Sage < 
( SELECT MAX ( Sage) 
FROM Student 
WHERE Sdept = ' 信 息 学 院 ') 
AND Sdept <>' 信 息 学 院 '; 


【 例 56】 查询 其 他 学 院 中 比 信息 学 院 所 有 学 生年 龄 都 小 的 学 生 姓名 及 年 龄 。 


SELECT Sname, Sage, Sdept 
FROM Student 
WHERE Sage < ALL ( SELECT Sage 
FROM Student 
WHERE Sdept = ' 信 息 学 院 ') 
AND Sdept <>' 信 息 学 院 '; 


解 题 说 明 : 

RDBMS 执行 此 查询 时 ,首先 处 理子 查询 , 找 出 信息 学 院 中 所 有 学 生 的 年 龄 ,构成 一 个 
集合 (19,18)。 然 后 处 理 父 查 询 , 找 所 有 不 是 信息 学 院 且 年 龄 小 于 19 岁 , 也 小 于 18 岁 的 学 
生 。 输 出 结果 为 : 


Sname Sage Sdept 
张 恒 17 机 械 学 院 


本 查询 同样 也 可 以 用 聚集 函数 来 完成 ,大 家 可 以 自行 实现 。 
事实 上 ,用 聚集 函数 实现 子 查询 通常 比 直接 用 ANY 或 ALL 查询 效率 要 高 。 因 为 聚集 
函数 通常 能 够 减少 比较 次 数 。ANY、ALL 与 聚集 函数 的 对 应 关系 如 表 3-9 所 示 。 
表 3-9 ANY( 或 SOME) ALL 谓词 与 聚集 函数 .IN 谓词 的 等 价 转换 关系 
= 二 > 或 != < 一 = > >= 
ANY IN 一 <MAX <=MAX >MIN >=MIN 
ALL 一 NOT IN <MIN <=MIN >MAX >=MAX 


表 3-9 中 ,ANY 等 价 于 IN 谓词 ,二 ANY 等 价 于 MAX, 一 二 ALL 等 价 于 NOT IN 谓 
词 ,<ALL 等 价 于 <MIN 等 。 

4. 带 有 EXISTS 谓词 的 子 查询 

EXISTS 代表 存在 量词 3 。 带 有 EXISTS 谓词 的 子 查询 不 返回 任何 数据 ,只 产生 人 逻辑 
真 值 *true” 或 逻辑 假 值 *false”。 

可 以 利用 EXISTS 来 判断 x<ES、SSER、S 二 R、SNR 非 空 等 是 否 成 立 。 

带 存在 谓词 的 子 查询 中 ,产生 逮 辑 值 谓词 EXISTS 作用 是 若 内 层 查询 结果 非 空 , 则 外 层 
的 WHERE 子 句 返回 真 ,否则 返回 假 。 由 EXISTS 引出 的 子 查询 ,其 目标 列表 达 式 通常 都 
用 "“* ”, 因 为 EXISTS 的 子 查询 只 返回 真 值 或 假 值 ,给 出 列 名 无 实际 意义 。 

这 类 查询 与 前 面 所 述 的 不 相关 子 查询 有 一 个 明显 区 别 , 即 子 查询 的 查询 条 件 依赖 于 外 
层 父 查询 的 某 个 属性 值 ,求解 相关 子 查询 不 能 像 求解 不 相关 子 查询 那样 ,一 次 性 将 子 查询 求 
解 出 来 ,然后 求解 父 查询 。 由 于 相关 子 查询 的 内 层 查 询 与 外 层 查询 有 关 , 因 此 必须 反复 求 
值 。 相 关子 查询 的 一 般 处 理 过 程 是 : 首先 取 外 层 查 询 表 中 的 第 1 个 元 组 ,根据 它 与 内 层 查 
询 相 关 的 属性 值 一 一 进行 判断 ,车 WHERE 子 句 返回 值 为 真 , 则 取 此 元 组 放 入 结果 表 ; 然 
后 再 取 外 层 查 询 表 的 下 一 个 元 组 ; 重复 这 一 过 程 ,直至 外 层 表 全 部 检查 完 为 止 。 

【 例 57】 查询 所 有 选修 了 03001 号 课程 的 学 生 姓名 。 


SELECT Sname 
FROM Student 


WHERE SC.Sno= Student.Sno AND Cno = '03001'); 


该 语句 的 一 种 可 能 的 执行 过 程 是 : 

QO@ 从 外 层 查询 中 取出 Student 的 第 一 个 元 组 ,将 元 组 的 Sno 值 (1703070101) 传 送 给 内 
层 查询 。 

SELECT * 

FROM SC 

WHERE Sno = '1703070101'; 

@ 执行 内 层 查 询 , 如 果 WHERE 子 句 返 回 值 为 真 。 

@ 执行 外 层 查询 , 取 外 层 查 询 中 该 元 组 的 Sname 放 入 结果 表 。 


Sname 


李 艺 


然后 外 层 查询 取出 Student 表 的 下 一 个 元 组 ; 重复 上 述 3 个 步骤 ,直至 外 层 Student 表 
全 部 处 理 为 止 。 输 出 结果 为 : 


Sname 


李 艺 
王 一 
吴 波 
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解 题 说 明 : 

@ 本 查询 涉及 Student 和 SC 两 个 表 。 在 处 理 时 , 先 从 Student 表 中 依次 取 每 个 元 组 的 
学 号 值 然后 用 此 值 去 检查 SC 表 中 是 否 有 该 学 号 且 Cno 为 '03001' 的 元 组 ; 若 有 , 则 子 查询 
的 WHERE 条件 为 真 ,该 学 生 元 组 中 的 姓名 输出 在 结果 集中 。 

@ 在 子 查询 的 条 件 中 ,由 于 当前 表 为 选课 SC 表 , 故 不 需要 用 表 名 限定 属性 ,而 Student 
表 ( 父 查询 中 的 源 表 ) 中 的 属性 需要 用 表 名 限定 。 

本 例 中 子 查 询 的 查询 条 件 依赖 于 外 层 父 查询 的 某 个 属性 值 (在 本 例 中 是 Student 的 
Sno) ,因此 是 相关 子 查询 。 本 例 的 查询 也 可 以 用 连接 运算 来 实现 ,读者 可 以 参照 有 关 的 例 
子 , 自 己 给 出 相应 的 SQL 语句 。 

与 EXISTS 谓词 相对 应 的 是 NOT EXISTS 谓词 ,其 含义 是 若 内 层 查询 结果 为 空 , 则 外 
层 的 WHERE 子 句 返回 真 值 ,否则 返回 假 值 。 

【 例 58】 查询 没 选修 03001 课程 的 学 生 学 号 及 姓名 。 

SELECT Sno, Sname 

FROM Student 

WHERE NOT EXISTS 

(SELECT * 
FROM SC 
WHERE SC. Sno = Student. Sno AND Cno = '03001'); 


解 题 说 明 : 

本 题 与 上 例 不 同 之 处 在 于 本 例 使 用 了 NOT EXISTS 操作 符 , 而 上 例 使 用 的 是 EXISTS 
操作 符 。 由 于 WHERE 子 句 中 的 条 件 是 元 组 选择 条 件 , 所 以 上 例 可 以 使 用 连接 查询 表示 ， 
而 本 例 不 能 使 用 下 面 的 连接 查询 表示 : 

SELECT Sname 


FROM Student, SC 
WHERE SC. Sno = Student. Sno AND Cno<>'03001'; 


SQL 语言 可 以 把 带 有 全 称 量词 的 谓词 转换 为 等 价 的 带 有 存在 量词 的 谓词 。 
【 例 59】 查询 没有 选任 何 课程 的 学 生 的 学 号 和 姓名 ， 
SELECT Sno, Sname 
FROM Student 
WHERE NOT EXISTS 
(SELECT * 
FROM SC 
WHERE SC. Sno= Student. Sno); 


执行 过 程 : 

@ 从 外 层 查询 中 取出 Student 的 第 一 个 元 组 ,将 元 组 的 Sno 值 (该 例 中 为 1703070101) 
传送 给 内 层 查 询 。 

SELECT * 


FROM SC 
WHERE Sno = '1703070101'; 


@ 执行 内 层 查询 ,如 果 在 SC 表 中 能 找到 Sno 一 '1703070101' 的 元 组 , 则 EXISTS 子 句 
返回 真 值 ,而 外 层 WHERE 条 件 为 假 值 ,查询 结果 表 不 输出 该 元 组 。 如 果 在 SC 表 中 未 找到 
SC. Sno 二 Student，Sno 的 元 组 (如 Sno 一 '1703070120') , 则 EXISTS 子 句 返 回 假 值 , 而 外 


层 WHERE 条 件 则 为 真 值 。 
@ 执行 外 层 查 询 , 取 外 层 查 询 中 该 元 组 的 Sno 和 Sname 放 入 结果 表 。 
Sno Sname 
1703070120 张 欣 
1703070302 何 穗 
1702030315 张 烛 
1704030302 吴 桐 


一 些 带 EXISTS 或 NOT EXISTS 谓词 的 子 查询 不 能 被 其 他 形式 的 子 查询 等 价 替 换 ， 
但 所 有 带 IN 谓词 .比较 运算 符 .SOME 和 ALL 渭 词 的 子 查询 都 能 用 带 EXISTS 谓词 的 子 


查询 等 价 蔡 换 。 
3.3.5 集合 查询 


SELECT 语句 的 查询 结果 是 元 组 的 集合 ,将 SELECT 语句 的 查询 结果 集 再 进行 集合 操 
作 就 构成 了 SQL 的 集合 查询 。 在 SQL 中 提供 了 下 列 可 以 直接 使 用 的 集合 运算 谓词 : 
UNION( 并 操作 ) INTERSECT( 交 操作 ) 和 EXCEPT( 差 操作 )3 种 。 前 提 是 参加 集合 运算 
的 两 个 关系 必须 具有 相等 的 目 , 且 对 应 的 属性 域 ( 即 数据 类 型 ) 也 必须 相同 。 

【 例 60】 求 选修 了 03001 课程 或 选修 了 03002 课程 的 学 生 学 号 。 


SELECT Sno 

FROM SC 

WHERE Cno = '03001' 

UNION 

SELECT Sno 

FROM SC 

WHERE Cno = '03002'7 

输出 结果 为 : 

Sno 

1701030322 
1703070101 
1703070125 
1703070211 

解 题 说 明 : 


Q@ 由 于 组 合 查 询 的 整体 是 一 个 查询 , 故 只 能 在 最 后 一 条 语句 的 后 面 加 结束 符号 *;”, 而 


不 能 在 每 个 子 查 询 子 句 后 加 结束 符号 。 


@ 组 合 查 询 中 的 每 个 子 查 询 结 果 集 的 结构 应 一 致 。 


@ 该 题 也 可 以 用 逻辑 运算 符 OR 操作 查询 代替 .但 查询 结果 输出 显示 有 所 不 同 。 本 例 
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中 输出 结果 只 有 四 个 (不 包含 重复 项 ); 而 下 面 的 例子 包含 了 重复 项 。 本 题 的 结果 为 : 按 
学 号 降序 排列 , 且 去 掉 重 复学 号 。 而 下 面 查询 结果 也 为 学 号 降序 排列 ,但 没有 去 掉 重 复 


学 
学 号 。 
SELECT Sno 
FROM SC 
WHERE Cno = '03001'0R Cno = '03002°'; 
输出 结果 为 : 
Sno 
1701030322 
1703070101 
1703070101 
1703070125 
1703070211 
1703070211 


【 例 61】 求 选修 '03001' 课 程 ,并 且 也 选修 '03002' 课 程 的 学 生 学 号 。 


SELECT Sno 

FROM SC 

WHERE Cno = '03001" 
INTERSECT 

SELECT Sno 

FROM SC 

WHERE Cno = '03002'; 


输出 结果 为 : 


Sno 


1703070101 
1703070211 


解 题 说 明 : 

@ 本 例 先 求 出 选修 '03001' 课 程 学 生 的 学 号 ,再 求 出 选修 '03002' 课 程 的 学 生 学 号 ,最 后 
将 两 者 进行 交 运 算 ,得 到 既 选修 '03001' 又 选修 '03002' 课 程 的 学 生 的 学 号 。 

@ 由 于 WHERE 子 句 是 元 组 选择 子 句 , 本 例 不 能 使 用 下 面 的 AND 操作 查询 表示 : 

SELECT Sno 


FROM SC 
WHERE Cno = '03001'AND Cno = '03002'; 


但 是 可 以 用 下 列 操作 完成 同样 的 功能 : 


SELECT Sno 

FROM SC 

WHERE Cno = '03001'AND Sno IN 
(SELECT Sno 


FROM SC 
WHERE Cno = '03002'); 


【 例 62】 求 选修 了 '03001' 课 程 但 没有 选修 '03002' 课 程 的 学 生 学 号 。 


SELECT Sno 

FROM SC 

WHERE Cno = '03001' 
EXCEPT 

SELECT Sno 

FROM SC 

WHERE Cno = '03002'7 


输出 结果 为 : 


Sno 


1701030322 


解 题 说 明 : 

本 例 先 求 出 选修 了 '03001' 课 程 的 学 生 学 号 集合 X, 再 求 出 选修 了 '03002 "课程 的 学 生 学 
号 集合 Y, 最 后 通过 差 操作 从 X 中 减 去 Y, 得 到 选修 了 '03001 ' 课 程 但 没有 选修 '03002 ' 课 程 
的 学 生 学 号 。 本 例 也 可 以 用 下 面 的 EXISTS 嵌 套 查询 表示 : 


SELECT Sno 
FROM SC SC1 
WHERE Cno = '03001'AND NOT EXISTS 
(SELECT Sno 
FROM SC SC2 
WHERE SC1. Sno = SC2. Sno AND Cno = '03002'); 


【 例 63】 查询 信息 学 院 的 学 生 与 年 龄 不 大 于 19 岁 的 学 生 的 差 集 。 


SELECT * 
FROM Student 

WHERE Sdept = ' 信 息 学 院 ' 
EXCEPT 

SELECT * 

FROM Student 

WHERE Sage <= 19; 


其 实 就 是 查询 信息 学 院 中 年 龄 大 于 19 岁 的 学 生 。 


SELECT x 
FROM Student 
WHERE Sdept = ' 信 息 学 院 'AND Sage > 19; 


3.3.6 SELECT 语句 的 一 般 格 式 


SELECT 语句 是 SQL 的 核心 语句 ,其 语句 成 分 非常 多 ,下 面 总 结 一 下 它们 的 一 般 


第 
3 
格式 。 
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SELECT 语句 的 一 般 格式 : 


SELECT[ ALL|DISTINCT]< 目 标 列 表达 式 >[ 别 名 ],< 目 标 列表 达 式 >[ 别 名 ]].…. FROM < 表 名 或 视图 名 >[ 别 
名 ][,< 表 名 或 视图 名 >[ 别 名 ]].… | (< SELECT 语句 >)[AS]< 别 名 > 

[WHERE < 条 件 表达 式 >] 

[GROUP BY< 列 名 1 > [HAVING < 条件 表达 式 >]] 

[ORDER BY < 列 名 2> [ASC|DESC]]; 


1. 目标 列表 达 式 有 以 下 可 选 格式 : 

Dx 

@ < 表 名 >. * 

@ COUNT(LDISTINCTIALL] *) 

@ [< 表 名 >. ]< 属 性 列 名 表达 式 >[ ,[< 表 名 >. ]< 属 性 列 名 表达 式 >]..… 

其 中 : < 属性 列 名 表达 式 > 可 以 是 由 属性 列 、 作 用 于 属性 列 的 聚集 函数 和 常量 的 任意 算 
术 运 算 ( 十 一 、* /) 组 成 的 运算 公式 。 

2. 聚集 函数 的 一 般 格 式 为 : 


COUNT 


AVG ([DISTINCT| ALL]< 列 名 >) 


3. WHERE 子 句 的 条 件 表达 式 有 以 下 可 选 格式 : 
(1) 
< 属性 列 名 > 


< 属性 列 名 > 8 [x | 
[ANY|ALL] (SELECT 语句 ) 


(2) 
< 属性 列 名 > < 属性 列 名 > 
< 属性 列 名 > Ionamma| < 二 a | 
(SELECT 语句 ) (SELECT 语句 ) 
(3) 
(< 值 1>[,< 值 2> ]…) 
< 属性 列 名 > [NOT] | | 
(SELECT 语句 ) 


(4) < 属性 列 名 > [NOT] LIKE < 匹配 串 > 
(5) < 属性 列 名 > IS [NOT] NULL 

(6) [NOT] EXISTS(SELECT 语句 ) 

(7) 


< 条 件 表 达 式 > [08 | < 条 件 表达 式 > [ {ox < 条 件 表 达 式 >] ~ 


3.4 数据 更 新 


数据 更 新 是 指 对 数据 库 表 中 的 数据 进行 增加 、 删 除 、 修 改 的 操作 ,在 SQL 中 有 相应 的 三 
类 语句 : INSERT( 插 入 )\UPDATE( 修 改 ) 和 DELETE( 删 除 ) 。 


3.4.1 插入 数据 


SQL 的 数据 插入 语句 INSERT 通常 有 两 种 形式 。 一 种 是 使 用 常量 ,一 次 插入 一 个 元 
组 ; 另 一 种 是 插 和 信子 查询 结果 ,一 次 可 以 插入 多 个 元 组 。 

1. 插 人 元 组 

插入 元 组 的 INSERT 语句 的 格式 为 : 

INSERT 

INTO < 表 名 > [ (< 属性 列 1 >[,< 属 性 列 2>.…)] 

VALUES(< 常 量 1 >[ ,< 常量 2>]...); 

上 述 语句 的 功能 是 将 新 元 组 插入 指定 表 中 。 其 中 新 元 组 的 属性 列 1 的 值 为 常量 1, 属 
性 列 2 的 值 为 常量 2…… 。INTO 子 句 中 没有 出 现 的 属性 列 , 新 元 组 在 这 些 列 上 将 取 空 值 。 
但 必须 注意 的 是 ,在 表 定义 时 假如 这 些 属性 已 定义 为 NOT NULL, 说 明了 该 属性 列 不 能 取 
空 值 , 它 将 会 出 错 。 如 果 INTO 子 句 中 没有 指明 任何 属性 列 名 , 则 新 插入 的 元 组 必须 在 每 
个 属性 列 上 均 有 值 。 

【 例 64】 将 一 个 新 学 生 元 组 (学 号 : 1703070201; 姓名 : 张 晓 ; 性 别 : 女 ; 所 属 学 院 : 
信息 学 院 ; 年 龄 : 18 岁 ) 插 入 到 Student 表 中 。 

INSERT 

INTO Student (Sno，Sname，Ssex，Sdept，Sage) 

VALUES ('1703070201', ' 张 晓 ', ' 女 ', ' 信 息 学 院 '，18); 

解 题 说 明 : 

在 INTO 子 句 中 指出 了 表 名 Student, 指 出 了 新 增加 的 元 组 在 哪些 属性 上 要 赋值 ,属性 
的 顺序 可 以 与 CREATE TABLE 中 的 顺序 不 一 样 。VALUES 子 句 对 新 元 组 的 各 属性 赋 
值 , 字 符 串 中 常数 要 用 单 引 号 (英文 符号 ) 括 起 来 。 

【 例 65】 将 一 个 新 学 生 记 录 ( 学 号 : 1703070201; 姓名 : 张 晓 ; 性 别 : 女 ; 所 属 学 院 : 
信息 学 院 ; 年 龄 : 18 岁 )) 插 入 到 学 生 表 Student 中 。 

INSERT 

INTO Student 

VALUES( '1703070201', ' 张 晓 ',18, ' 女 ', ' 信 息 学 院 '); 

解 题 说 明 : 

本 题 Student 表 后 无 属性 列 ,VALUES 子 句 的 常量 与 Student 表 字 有 段 的 逻辑 顺序 对 应 ， 
该 字段 顺序 为 学 号 、 姓 名 .性别 .年龄 和 所 属 学 院 。 

上 述 例题 不 同 的 是 在 INTO 子 句 中 只 指出 了 表 名 ,没有 指出 属性 名 ,这 表示 新 元 组 要 
在 表 的 所 有 属性 列 上 都 指定 值 ,属性 列 的 次 序 与 CREATE TABLE 中 的 次 序 相 同 。 
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VALUES 子 句 对 新 元 组 的 各 属性 列 赋值 ,一 定 要 注意 值 与 属性 列 要 一 一 对 应 ,如 果 像 
例 64 那 样 ,VALUES 子 句 变 成 ('1703070201',' 张 晓 ',' 女 ',' 信 息 学 院 ',18) 这 样 的 顺序 , 则 
含义 是 将 ' 女 ' 赋 给 了 Sage,' 信 息 学 院 ' 的 值 赋 给 了 属性 列 Ssex, 而 18 赋 给 了 属性 列 Sdept, 这 
样 则 会 因为 数据 类 型 不 同 而 出 错 。 

如 果 数 据 类 型 是 相同 的 两 个 属性 列 ,就 会 赋 成 错误 的 值 。 

【 例 66】 插入 一 条 选课 记录 (学 号 : 1703070201; 课程 号 : 03001; 成 绩 不 详 ) 。 

INSERT 

INTO SC (Sno, Cno) 

VALUES ('1703070201"', '03001'); 

解 题 说 明 : 

本 例 选课 表 SC 后 的 学 号 Sno 和 课程 号 Cno 两 个 属性 与 常量 *1703070201” 和 “03001” 
对 应 ,没有 出 现在 选课 表 后 的 成 绩 属 性 ,插入 值 为 NULL。 由 于 选课 表 后 列 出 的 属性 与 定 
义 表 时 的 顺序 一 致 ,该 例 还 可 以 用 下 面 的 形式 表达 : 

INSERT 

INTO SC 

VALUES( '1703070201"', '03001', NULL); 

解 题 说 明 : 

因为 没有 指出 SC 的 属性 名 ,在 Grade 属性 上 要 明确 给 出 空 值 。 

2. 在 表 中 插 人 子 查 询 的 结果 集 

子 查询 不 仅 可 以 赃 套 在 SELECT 语句 中 ,用 以 构造 父 查询 的 条 件 ( 如 3. 3. 4 节 所 述 ) 。 
如 果 插 入 的 数据 需要 查询 才能 得 到 , 则 子 查询 也 可 以 骨 套 在 INSERT 语句 中 ,以 便 将 查询 
得 到 的 结果 集 作为 批量 数据 输入 到 表 中 。 

含有 子 查询 的 INSERT 语句 的 格式 为 : 

INSERT 

INTO < 表 名 >[ (< 属性 列 1 >[,< 属 性 列 2 >.…)] 

< 子 查询 >; 

【 例 67】 求 各 个 课程 的 平均 分 数 , 并 把 结果 存 和 数据库 中 。 

首先 在 数据 库 中 建立 一 个 新 表 , 其 中 一 列 存放 课程 号 , 另 一 列 存放 对 应 课程 平均 分 。 

CREATE TABLE Cno_Grade 


(Cno CHAR ( 10), 
Avg_Grade SMALLINT); 


然后 对 SC 表 按 课程 号 分 组 求 平均 分 ,再 把 课程 号 和 平均 分 数 存 人 新 表 中 。 


INSERT 

INTO Cno_Grade( Cno, Avg_Grade) 
SELECT Cno, AVG(Grade) 

FROM SC 

GROUP BY Cno; 


解 题 说 明 : 


本 题 首先 用 CREATE TABLE 语句 建立 了 学 院 平 均 成 绩 基 本 表 , 后 又 使 用 INSERT 
语句 将 在 学 生 选 课 SC 表 中 查询 得 到 的 课程 号 及 每 门 课 的 平均 分 插入 到 平均 分 表 中 。 


3.4.2 修改 元 组 

修改 操作 又 称 为 更 新 操作 ,其 语句 的 一 般 格 式 为 : 

UPDATE < 表 名 > 

SET < 属性 列 1 > = < 表达 式 1 >[,< 属 性 列 2 > = < 表达 式 2>]... 

[WHERE < 条 件 >]; 

SQL 的 修改 数据 语句 功能 是 : 将 指定 表 中 那些 符合 WHERE 子 句 条 件 的 元 组 的 某 些 
列 , 用 SET 子 句 中 给 出 的 表达 式 的 值 蔡 代 。 如 果 省 略 WHERE 子 句 , 则 表示 要 修改 表 中 的 
所 有 元 组 。 需 要 指出 的 是 ,与 INSERT 类 似 , 在 UPDATE 的 WHERE 子 句 中 也 可 以 舱 入 
查询 语句 。 

1. 修改 某 一 个 元 组 的 值 

【 例 68】 将 学 生 1703070101 的 年 龄 改 为 19 岁 。 

UPDATE Student 

SET Sage= 19 

WHERE Sno = '1703070101 

2. 修改 多 个 元 组 的 值 

【 例 69】 将 所 有 学 生 的 年 龄 增加 1 岁 。 

UPDATE Student 

SET Sage = Sage + 1; 

解 题 说 明 : 

Q@ 由 于 该 题 要 求 修改 全 部 学 生 记录 ,所 以 不 需要 WHERE 子 句 对 修改 的 记录 加 以 选择 。 

@ SET 子 句 中 的 “Sage 二 Sage 十 1” 为 赋值 语句 , 它 使 每 个 元 组 用 原 年 龄 加 上 1 作为 新 
年 龄 。 

3. 带子 查询 的 修改 语句 

子 查 询 也 可 以 嵌 套 在 UPDATE 语句 中 ,用 以 构造 修改 的 条 件 。 

【 例 70】 将 选课 表 中 的 数据 库 原理 课程 的 成 绩 乘 以 1. 2。 

UPDATE SC 

SET Grade = Grade * 1.2 

WHERE Cno = (SELECT Cno 


FROM Course 
WHERE Cname = ' 数 据 库 原理 ') ; 


解 题 说 明 : 

该 例 中 的 元 组 修改 条 件 是 数据 库 原理 课程 ,而 在 选课 表 中 只 有 课程 号 而 无 课程 名 , 因 
此 ,要 通过 在 课程 表 中 查找 课程 名 为 数据 库 的 课程 号 ,才能 确定 修改 的 元 组 ,所 以 该 题 的 
WHERE 子 句 中 使 用 了 子 查询 。 该 题 也 可 以 表示 为 以 下 形式 : 


UPDATE SC 
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SET Grade = Gradex 1.2 
WHERE' 数 据 库 原理 ' = (SELECT Cname 
FROM Course 
WHERE SC. Cno = Course. Cno) ; 


【 例 71】 当 某 学 生 03001 号 课程 的 成 绩 低 于 该 门 课程 的 平均 成 绩 时 ,提高 10%。 


UPDATE SC 

SET Grade = Grade * 1.10 

WHERE Cno = '03001' AND Grade < 

(SELECT AVG (Grade) 

FROM SC 

WHERE Cno = '03001'); 

解 题 说 明 : 

这 里 在 内 层 子 句 中 引用 了 外 层 UPDATE 子 句 中 出 现 的 关系 名 SC, 但 这 两 次 引用 是 不 
相关 的 , 即 这 个 修改 语句 执行 时 , 先 执行 内 层 SELECT 语句 ,然后 再 对 查找 到 的 元 组 执行 修 
改 操作 ,而 不 是 边 找 元 组 边 修改 。 换 言 之 ,对 要 修改 的 关系 中 所 有 元 组 进行 测试 是 否 需要 修 
改 后 ,再 对 元 组 进行 修改 。 这 样 的 修改 操作 在 语义 上 是 不 会 出 现 问 题 的 ,在 插入 语句 和 删除 
语句 遇 到 类 似 情况 时 ,也 是 如 此 进行 处 理 。 


3.4.3 删除 元 组 
数据 删除 语句 用 DELETE 语句 ,其 语句 的 一 般 格式 为 : 


DELETE 

FROM < 表 名 > 

[WHERE < 条 件 表 达 式 >]; 

DELELE 语句 的 功能 是 从 指定 表 中 删除 满足 WHERE 子 句 条 件 的 所 有 元 组 。 如 果 在 
数据 删除 语句 中 省 略 WHERE 子 句 ,表示 删除 表 中 全 部 元 组 ,但 表 的 定义 仍 在 字典 中 。 也 
就 是 说 ,DELETE 语句 删除 的 是 表 中 的 数据 ,而 不 是 关于 表 的 定义 ,即使 表 中 的 数据 全 部 被 
删除 , 表 的 定义 仍 在 数据 库 中 。 

和 UPDATE 语句 一 样 , DELETE 语句 中 可 以 嵌入 SELECT 的 查询 语句 。 一 个 
DELETE 语句 只 能 删除 一 个 表 中 的 元 组 , 它 的 FROM 子 句 中 只 能 有 一 个 表 名 ,不 允许 有 多 
个 表 名 。 即 如 果 需 要 删除 多 个 表 的 数据 ,就 需要 用 多 个 DELETE 语句 。 

1. 删除 某 一 个 元 组 的 值 

【 例 72】 删除 学 号 为 1703070101 学 生 的 选课 记录 。 

DELETE 

FROM SC 

WHERE Sno = '1703070101'; 

解 题 说 明 

需要 注意 ,该 删除 操作 可 能 破坏 参照 完整 性 。 

2. 删除 多 个 元 组 的 值 

【 例 73】 删除 所 有 的 学 生 选 课 记 录 。 


DELETE 


FROM SC 


解 题 说 明 : 

这 条 DELETE 语句 将 使 SC 成 为 空 表 , 它 删除 了 SC 的 所 有 元 组 。 

3. 带子 查询 的 删除 语句 

子 查询 同样 也 可 以 嵌 套 在 DELETE 语句 中 ,用 以 构造 执行 删除 操作 的 条 件 。 
【 例 74】 删除 信息 学 院 的 学 生 记录 及 选课 记录 。 


DELETE 
FROM SC 
WHERE Sno IN(SELECT Sno 
FROM Student 
WHERE Sdept = ' 信 息 学 院 ')， 
DELETE 
FROM Student 
WHERE Sdept = ' 信 息 学 院 '; 
解 题 说 明 : 


该 题 中 使 用 了 两 条 数据 删除 语句 ,一 条 用 于 删除 学 生 选 课 SC 表 , 另 一 条 用 于 删除 学 生 
表 。 由 于 在 删除 选课 表 时 需要 查询 学 生 表 , 故 不 能 把 这 两 条 语句 的 执行 顺序 颠倒 。 假 若 先 
删除 了 学 生 记 录 ,就 得 不 到 信息 学 院 学 生 的 学 号 ,对 应 的 选课 记录 就 无 法 删除 了 。 

对 某 个 基本 表 中 数据 的 增 、 删 、 改 操作 都 有 可 能 会 破坏 参照 完整 性 ,在 7.4 节 将 详细 介 
绍 如 何 进行 参照 完整 性 定义 ,参照 完整 性 检查 及 违约 处 理 。 


3.5 视图 的 定义 和 维护 


视图 是 根据 外 模式 ( 子 模式 ) 设 计 的 关系 。 它 是 由 一 个 或 几 个 基本 表 ( 或 已 定义 的 视图 ) 
导出 的 虚 表 。 所 谓 虚 表 , 就 是 非 物理 存在 , 它 不 包含 真正 存储 的 数据 ,其 内 容 不 占 存 储 空间 。 
即 在 数据 库 中 只 存放 视图 的 定义 ,而 不 存放 视图 对 应 的 数据 。 而 真正 物理 存在 的 表 称 作 基 
本 表 或 实 表 。 

因此 ,视图 最 终 是 定义 在 基本 表 之 上 的 ,对 视图 的 一 切 操作 最 终 也 要 转换 为 对 基本 表 的 
操作 。 既 然 如 此 ,为 什么 还 要 定义 视图 呢 ? 这 是 因为 视图 有 以 下 优点 : 


3.5.1 视图 的 作用 


1. 简化 用 户 的 操作 

视图 机 制 可 以 使 用 户 将 注意 力 集中 在 所 关心 的 数据 上 ,进而 减少 用 户 对 数据 库 中 数据 
结构 的 调整 操作 。 使 用 户 眼 中 的 数据 库 结构 简单 、 清 晰 、 并 且 可 以 简化 用 户 的 复杂 查询 操 
作 。 例 如 ,可 以 将 若干 表 连 接 的 查询 定义 为 视图 ,视图 将 表 与 表 之 间 的 连接 操作 对 用 户 隐 项 
起 来 了 ,用 户 所 看 到 的 和 使 用 的 是 多 表 连 接 后 的 虚 表 。 换 句 话说 ,用 户 所 做 的 指示 对 一 个 虚 
表 进 行 简单 的 查询 操作 ,而 这 个 虚 表 是 如 何 得 来 的 ,用 户 无 须 了 解 。 

2. 视图 是 用 户 用 来 看 数据 的 窗口 

视图 就 像 一 个 窗口 , 它 可 以 使 不 同 的 用 户 从 多 种 角度 以 不 同 的 方式 看 待 同一 数据 。 当 
许多 不 同 种 类 的 用 户 使 用 同一 个 数据 库 时 ,这 种 灵活 性 是 非常 重要 的 。 通 过 视图 可 以 实现 
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各 个 用 户 对 数据 的 不 同 使 用 要 求 。 任 何 对 基 表 中 所 映射 的 数据 更 新 ,通过 该 窗口 在 视图 可 
见 的 范围 内 都 可 以 自动 和 实时 的 再 现 。 

3. 对 视图 的 一 切 操作 最 终 将 转换 为 对 基本 表 的 操作 

用 户 对 视图 允许 的 更 新 也 将 自动 和 实时 地 在 相应 基 表 所 映射 的 数据 上 实现 。 

4. 一 定 程 度 上 提高 了 逻辑 独立 性 

在 关系 数据 库 中 ,数据 库 的 重 构 往往 是 不 可 避免 的 。 而 有 了 视图 机 制 , 当 数 据 库 重 构 
时 ,有 些 表 结构 的 变化 ,如 增加 新 的 关系 、 结 构 的 分 解 或 对 原 有 关系 增加 新 的 属性 等 ,用 户 和 
用 户 程序 不 会 受 影响 。 视 图 对 重 构 数据 库 提 供 了 一 定 程 度 的 逻辑 独立 性 。 

最 常见 的 重 构 数 据 库 是 将 一 个 基本 表 * 垂 直 ? 或 “水 平 " 地 分 成 多 个 基本 表 。 

例如 , 设 原 基本 表 为 学 生 关系 (学 号 ,姓名 ,性 别 ,年 龄 ,所 在 学 院 ) ,由 于 某 种 原因 需要 把 
它 分 为 : 

SX( 学 号 ,姓名 ,年 龄 ) 

SY( 学 号 ,性 别 ,所 在 学 院 ) 

可 以 利用 视图 方法 使 原 学 生 关 系 表 在 使 用 中 仍然 有 效 。 学 生 视 图 为 SX 表 和 SY 表 自 
然 连 接 的 结果 ,其 定义 语句 如 下 : 

CREATE VIEW 学 生 ( 学 号 ,姓名 ,性 别 ,年 龄 ,所 在 学 院 ) 

RS SELECT SX. 学 号 , SX. 姓名 , SX. 性 别 , SY. 年 龄 ,SY. 所 在 学 院 

FROM SX, SY 

WHERE SX. 学 号 = SY. 学 号 

上 例 中 ,尽管 数据 库 的 迎 辑 结构 改变 了 ,但 由 于 有 视图 机 制 , 新 建立 的 视图 为 应 用 程序 
提供 了 原来 使 用 的 关系 ,使 数据 库 的 外 模式 保持 不 变 。 原 有 的 应 用 程序 通过 视图 仍 能 查找 
到 数据 ,所 以 应 用 程序 不 必修 改 仍 可 以 正常 运行 。 

实际 上 视图 只 能 提供 一 定 程度 的 数据 独立 性 。 视 图 与 表 一 样 可 被 查询 删除 , 即 可 以 像 
一 般 的 表 那 样 操作 ,这 是 由 于 对 视图 的 更 新 是 有 条 件 的 ,因此 对 应 用 程序 中 的 修改 数据 语 
句 , 会 因 基 本 表 结 构 的 改变 而 需要 改变 修改 对 象 。 

5. 提供 安全 保护 

有 了 视图 机 制 , 在 设计 数据 库 应 用 系统 时 ,针对 不 同 用 户 定义 不 同 的 视图 ,使 机 密 数 据 
不 出 现在 不 应 看 到 这 些 数据 的 用 户 视 图 上 。 这 样 就 由 视图 机 制 自动 提供 了 对 机 密 数 据 的 安 
全 保护 功能 。 

例如 Student 表 涉 及 全 校 10 个 学 院 的 学 生 数 据 ,可 以 在 其 上 定义 10 个 视图 ,每 个 视图 
只 包含 一 个 学 院 的 学 生 数 据 ,并 只 允许 每 个 学 院 的 院 长 查询 和 修改 自己 学 院 学 生 的 视图 。 

合理 地 使 用 视图 能 够 对 系统 的 设计 和 用 户 的 使 用 带 来 很 多 方便 。 


3.5.2 定义 视图 
SQL 语言 用 CREATE VIEW 命令 建立 视图 ,其 一 般 格式 为 : 


CREATE VIEN < 视图 名 >[{< 属 性 名 1 >[,< 属 性 名 2>].…}] 
AS < 子 查询 > 
[WITH CHECK OPTION]; 


该 语句 的 功能 为 : 定义 视图 名 和 视图 结构 ,将 < 子 查询 > 得 到 的 元 组 作为 视图 的 内 容 。 

定义 视图 的 格式 中 ,有 两 点 需要 说 明 。 

1. WITH CHECK OPTION 选项 

选择 项 WITH CHECK OPTION 表示 在 对 视图 进行 UPDATE .INSERT 和 DELETE 
操作 时 ,要 保证 操作 的 数据 满足 视图 定义 中 的 谓词 条 件 。 该 谓词 条 件 是 视图 子 查询 中 的 
WHERE 子 句 的 条 件 。 

2. 组 成 视图 的 属性 列 名 全 部 省 略 或 者 全 部 指定 ,没有 第 三 种 选择 

若 省 略 了 视图 的 各 个 属性 列 名 , 则 隐 含 该 视图 的 属性 是 由 子 查询 中 的 SELECT 子 句 的 
目标 列 中 的 诸 字 段 组 成 。 

必须 明确 指定 组 成 视图 的 所 有 列 名 的 3 种 情况 是 : 

中 某 个 目标 列 不 是 单纯 的 属性 名 ,而 是 聚集 函数 或 列表 达 式 。 

@ 子 查询 中 使 用 多 个 表 ( 或 视图 ) ,并 且 目 标 列 中 含有 相同 的 属性 名 。 

@ 需要 在 视图 中 为 某 个 列 启用 新 的 、 更 合适 的 列 名 。 

其 中 , 子 查询 可 以 是 任意 复杂 的 SELECT 语句 ,但 不 允许 含有 ORDER BY 子 句 和 
DISTINCT 短语 。 

【 例 75】 建立 一 个 只 包括 女 学 生 学 号 、 姓 名 和 年 龄 的 视图 S_FS。 

CREATE VIEW S_FS 

AS 

SELECT Sno, Sname, Sage 

FROM Student 

WHERE Ssex = ' 女 '; 

解 题 说 明 : 

@ 该 例 是 由 一 个 基本 表 生 成 的 视图 ,并 忽略 了 视图 S_FS 的 列 名 ,该 视图 的 属性 列 由 子 
查询 中 SELECT 子 句 中 的 3 个 列 名 组 成 。 

@ 本 例 中 子 查 询 的 含义 是 在 学 生 表 中 查询 全 体 女 学 生 的 学 号 、 姓 名 和 年 龄 。 

DBMS 执行 CREATE VIEW 语句 的 结果 只 是 把 视图 的 定义 存 和 人 数据 字典 中 ,并 不 执 
行 其 中 的 SELECT 语句 。 只 有 在 对 视图 查询 时 , 才 按 视图 的 定义 将 从 基本 表 中 查 到 的 结果 
集 作为 视图 数据 。 因 基本 表 随 着 更 新 操作 在 不 断 变化 ,所 以 视图 对 应 的 内 容 是 实时 、 最 新 的 
内 容 , 并 非 总 是 视图 定义 时 的 内 容 。 

【 例 76】 建立 信息 学 院 学 生 的 视图 ,并 要 求 进行 修改 和 插入 操作 时 仍 需 保证 该 视图 只 
有 信息 学 院 的 学 生 记 录 。 

CREATE VIEW INFO_Student 

RS 

SELECT Sno, Sname, Sage, Ssex 

FROM Student 

WHERE Sdept = ' 信 息 学 院 ' 

WITH CHECK OPTION; 

解 题 说 明 : 

@ 该 例 是 由 一 个 基本 表 生 成 的 视图 ,本 例 忽 略 了 视图 的 属性 列表 。 

@) 本 例 建立 了 信息 学 院 全 体 学 生 的 视图 。 
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@ 这 个 视图 INFO_Student 是 由 子 查询 “SELECT * ”建立 的 ,INFO_Student 视图 的 
属性 列 与 Student 表 的 属性 列 一 一 对 应 。 如 果 以 后 修改 了 基本 表 Student 的 结构 , 则 
Student 表 与 INFO_Student 视图 的 映像 关系 就 被 破坏 了 ,该 视图 就 不 能 正常 工作 了 。 为 了 
避免 出 现 这 类 问题 ,最 好 在 修改 基本 表 之 后 删除 由 该 基本 表 导 出 的 视图 ,然后 再 重新 建立 这 
个 视图 。 

@ 由 于 在 INFO_ Student 视图 定义 时 加 上 了 WITH CHECK OPTION 子 句 ,以 后 对 
该 视图 进行 插入 、 修 改 和 删除 操作 时 ,DBMS 会 自动 加 上 Sdept= ' 信 息 学 院 ' 的 条 件 。 

若 一 个 视图 是 从 单个 基本 表 导 出 的 ,并 且 只 是 去 掉 了 基本 表 中 的 某 些 行 或 某 些 列 ,但 保 
留 了 主 码 , 称 这 类 视图 为 行列 子 集 视 图 。 例 75 和 例 76 两 个 例题 定义 的 视图 均 由 一 个 基本 
表 构 造 , 均 为 行列 子 集 视图 。 

另外 ,视图 不 仅 可 以 建立 在 一 个 基本 表 上 ,还 可 以 由 多 个 基本 表 (或 已 经 生成 的 视图 ) 导 
出 ,也 可 以 由 统计 操作 或 表达 式 得 到 。 

【 例 77】 由 学 生 、 课 程 和 选课 3 个 基本 表 , 定 义 一 个 信息 学 院 的 学 生成 绩 视图 ,其 属性 

CREATE VIEW IS_G(IS Sno,IS Sname, IS Cno, IS Cname, IS Grade) 

RS SELECT Student.Sno,Sname,Course.Cno,Cname,Grade 

FROM Student, Course, SC 

WHERE Student. Sno = SC. Sno AND Course. Cno = SC. Cno 

AND Sdept = ' 信 息 学 院 '; 

解 题 说 明 : 

名 该 例 是 一 个 由 3 个 基本 表 连 接 查询 构造 的 视图 ; 

@ 由 于 查询 的 结果 列 中 有 表 名 限定 ,所 以 结果 列 名 不 能 作为 视图 的 列 名 ,因而 在 该 例 
中 视图 名 后 指定 了 视图 列 名 。 

【 例 78】 建立 信息 学 院 选 修了 03001 号 课程 且 成 绩 在 90 分 以 上 的 学 生 的 视图 。 

CREATE VIEW IS_G90_C1(Sno, Sname, Grade) 

RS 

SELECT IS_Sno, IS_Sname, IS_Grade 

FROM ISG 

WHERE IS_Cno = '03001'AND IS_Grade> 90; 

解 题 说 明 : 

该 例 的 视图 就 是 建立 在 IS_G 视图 之 上 的 。 

定义 基本 表 时 ,为 了 减少 数据 的 宛 余 , 表 中 只 存放 基本 数据 ,由 基本 数据 经 过 各 种 计算 
派生 出 的 数据 一 般 是 不 存储 的 。 但 由 于 视图 中 的 数据 并 不 实际 存储 ,所 以 定义 视图 时 ,可 以 
根据 应 用 的 需要 ,设置 一 些 派生 属性 列 。 这 些 派 生 属 性 由 于 在 基本 表 中 并 不 实际 存在 ,因此 
也 称 它们 为 虚拟 列 。 带 虚拟 列 的 视图 也 称 为 带 表 达 式 的 视图 。 

【 例 79】 定义 一 个 反映 学 生出 生年 份 的 视图 

CREATE VIEW S_BT( Sno, Sname, Sbirth) 

RS 


SELECT ”Sno, Sname,2017 - Sage 
FROM Student; 


解 题 说 明 : 

S_BT 视图 是 一 个 带 有 表达 式 的 视图 ,因而 本 例 必 须要 指定 视图 列 名 。 视 图 中 的 出 生 
年 份 是 通过 计算 得 到 的 。 

【 例 80】 将 每 个 学 生 的 学 号 ,总 成 绩 、 平 均 成 绩 定 义 成 一 个 视图 。 

CREATE VIEW S_G(Sno, Gsum, Gavg) 

AS SELECT Sno,SUM(Grade),AVG(Grade) 

FROM SC 

GROUP BY Sno; 

解 题 说 明 : 

@ S_G 视图 是 一 个 带 有 表达 式 的 视图 ,由 于 查询 结果 中 使 用 了 聚集 函数 ,因而 本 例 必 
须要 指定 视图 列 名 ; 

@ 该 例 是 一 个 按 学 号 分 组 统计 的 查询 构造 的 视图 ,该 视图 是 一 个 分 组 视图 。 


3.5.3 删除 视图 


视图 建 好 后 , 若 导出 此 视图 的 基本 表 被 删除 , 则 该 视图 将 失效 ,但 视图 定义 一 般 不 会 被 
自动 删除 (除非 指定 了 基本 表 的 级 联 删除 CASCADE) , 故 要 用 语句 进行 显 式 删 除 ,该 语句 的 
一 般 格 式 为 : 


DROP VIEW < 视图 名 > [CASCADE |RESTRICT ] 


说 明 : 如 果 指 定 了 CACSADE 方式 , 则 进行 级 联 删 除 。 随 该 视图 删除 ,在 该 视图 上 所 建 
的 所 有 视图 将 全 部 随 之 消失 。 

如 果 指 定 了 RESTRICT 方式 , 则 进行 限制 删除 。 只 有 无 相关 对 象 (无 其 他 视图 、 约 束 
等 定义 涉及 ) 的 视图 才能 被 撤销 。 

视图 删除 后 ,视图 的 定义 将 从 数据 字典 中 删除 ,如 果 该 视图 上 导出 了 其 他 视图 , 则 这 些 
视图 的 定义 仍 存在 于 数据 字典 中 ,但 这 些 视图 已 失效 。 为 了 防止 用 户 在 使 用 时 出 错 , 可 以 使 
用 CASECADE 级 联 删 除 语句 ,把 该 视图 和 由 它 导出 的 所 有 视图 一 起 删除 。 

【 例 81】 删除 视图 S_BT 


DROP VIEW S_BT; 
【 例 82】 删除 IS_G 视图 
DROP VIEW IS_G; 


解 题 说 明 

执行 此 语句 时 由 于 IS_G 视图 上 还 导出 了 IS_G90_C1 视图 ,所 以 该 语句 执行 后 ,虽然 
IS_G90_C1 视图 的 定义 仍然 在 数据 字典 中 ,但 已 无 法 使 用 ,所 以 需要 使 用 DROP VIEW IS_ 
G90_C1 将 其 删除 。 


3.5.4 查询 视图 


一 旦 视图 定义 好 后 ,用 户 就 可 以 像 对 基本 表 一 样 对 视图 进行 查询 了 。 也 就 是 说 ,在 前 面 
介绍 的 对 表 的 各 种 查询 操作 都 可 以 作用 于 视图 。 
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DBMS 执行 对 视图 的 查询 时 ,首先 要 进行 有 效 性 检查 。 涉 及 基本 表 、 视 图 等 是 否 在 数 
据 库 中 存在 。 如 果 存 在 , 则 从 数据 字典 中 取出 查询 涉及 的 视图 的 定义 ,把 定义 中 的 子 查询 和 
用 户 对 视图 的 查询 结合 起 来 ,转换 成 对 基本 表 的 查询 ,然后 再 执行 这 个 经 过 修正 的 查询 。 这 
种 将 对 视图 的 查询 转换 为 对 基本 表 的 查询 的 过 程 称 为 视图 的 消解 (View Resolution)。 

【 例 83】 查询 信息 学 院 学 生 的 视图 (在 例 76 中 ) 找 出 年 龄 小 于 20 岁 的 学 生 。 

SELECT Sno, Sname, Sage 


FROM INFO_Student 
WHERE Sage < 20; 


本 例 转换 后 的 查询 语句 为 : 


SELECT Sno, Sname, Sage 
FROM Student 
WHERE Sdept = ' 信 息 学 院 ' AND Sage < 20; 


【 例 84】 查询 选修 了 03001 号 课程 的 信息 学 院 的 学 生 学 号 和 姓名 。 


SELECT INFO_Student. Sno, Sname 

FROM INFO_Student, SC 

WHERE INFO_Student. Sno = SC. Sno AND SC.Cno = '03001°'; 

解 题 说 明 : 

本 例 的 查询 涉及 视图 INFO_Student( 虚 表 ) 和 基本 表 SC, 通 过 这 两 个 表 的 连接 来 完成 

在 一 般 情 况 下 ,视图 查询 的 转换 是 直截了当 的 。 但 有 些 情况 下 ,这 种 转换 不 能 直接 进 
行 ,查询 时 就 会 出 现 问题 ,如 下 例 。 

【 例 85】 在 S_G 视图 中 (在 例 80 中 定义 的 ?查询 平均 成 绩 在 90 分 以 上 的 学 生 的 学 号 
及 平均 成 绩 。 

SELECT Sno, Gavg 


FROM S_G 
WHERE Gavg > = 90; 


在 例 80 中 定义 S_G 视图 的 子 查询 为 : 


SELECT Sno, AVG( Grade) 
FROM SC 
GROUP BY Sno; 


将 本 例 中 的 查询 语句 与 定义 S_G 视图 的 子 查询 结合 ,形成 下 列 查询 语句 : 


SELECT Sno, AVG( Grade) 

FROM SC 

WHERE AVG( Grade)> = 90 

GROUP BY Sno; 

因为 WHERE 于 句 中 是 不 能 用 聚集 函数 作为 条 件 表达 式 的 ,因此 执行 此 修正 后 的 查询 
将 会 出 现 语法 错误 。 正 确 转 换 的 查询 语句 应 该 是 : 


SELECT Sno, AVG( Grade) 


FROM SC 
GROUP BY Sno 
HAVING AVG( Grade)>= 90; 


目前 多 数 关 系数 据 库 系统 对 行列 子 集 视图 的 查询 均 能 进行 正确 的 转换 。 但 对 非 行列 子 
集 视图 的 查询 (如 例 85) 就 不 一 定 能 作 转 换 了 ,因此 这 类 查询 应 该 直接 对 基本 表 进 行 。 


3.5.5 更 新 视图 


由 于 视图 是 不 实际 存储 数据 的 虚 表 ,因此 对 视图 的 更 新 ,最 终 要 转换 为 对 表 的 更 新 , 即 
通过 对 表 的 更 新 来 实现 视图 更 新 。 

更 新 视图 包括 插入 (INSERT) ,删除 (DELETE) 和 修改 (UPDATE) 三 类 操作 。 

目前 ,大 部 分 数据 库 产品 都 能 够 正确 地 对 视图 进行 数据 查询 的 操作 ,但 还 不 能 对 视图 作 
任意 的 更 新 操作 ,因此 视图 的 更 新 操作 还 不 能 实现 逻辑 上 的 数据 独立 性 。 

为 防止 用 户 通过 视图 对 数据 进行 增 、 删 . 改 时 ,无 意 或 故意 操作 不 属于 视图 范围 内 的 表 
的 数据 ,可 在 定义 视图 时 加 上 WITH CHECK OPTION 子 句 ,这 样 在 视图 上 增 、 删 、 改 数据 
时 ,DBMS 会 进一步 检查 视图 定义 中 的 条 件 ,车 不 满足 条 件 , 则 拒绝 执行 该 操作 。 

删除 .修改 操 作 ,会 受到 一 定 的 限制 。 一 般 的 数据 库 系 统 只 允许 对 行列 子 集 的 视图 进行 
更 新 操作 。 行 列子 集 视图 是 指 从 单个 基本 表 导 出 , 虽 去 掉 了 基本 表 的 某 些 行 和 某 些 列 但 保 
留 了 码 。 

【 例 86】 向 信息 学 院 学 生 视图 INFO_Student 中 插入 一 个 新 的 学 生 记录 ,其 中 学 号 为 
1703070110, 姓 名 为 赵 照 ,年 龄 为 20 岁 ,性 别 为 男 。 

INSERT 


INTO INFO_Student 
VALUES( '1703070110'，' 赵 照 '，20, ' 男 '); 


转换 为 对 基本 表 的 更 新 : 


INSERT 

INTO Student (Sno, Sname, Sage, Ssex, Sdept) 

VALUES( '1703070110'，' 赵 照 '，20, ' 男 ', ' 信 息 学 院 '); 

解 题 说 明 : 

这 里 系统 自动 将 所 属 学 院 名 ' 信 息 学 院 ' 放 入 VALUES 子 名 中 。 

【 例 87】 将 信息 学 院 学 生 视 图 INFO_Student 中 学 号 为 1703070110 的 学 生 姓名 改 为 
' 赵 雷 '。 

UPDATE INFO_Student 


SET Sname = ' 赵 雷 ' 
WHERE Sno = '1703070110"; 


转换 后 的 更 新 语句 为 : 


UPDATE Student 
SET Sname = ' 赵 雷 ' 
WHERE Sno = '1703070110'AND ”Sdept = ' 信 息 学 院 '; 
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这 里 系统 自动 将 所 属 学 院 名 ' 信 息 学 院 ' 放 入 WHERE 子 句 中 。 
【 例 88】 删除 信息 学 院 学 生 视图 INFO_Student 中 学 号 为 1703070110 的 学 生 元 组 。 
DELETE 


FROM INFO_Student 
WHERE Sno = '1703070110'; 


转换 为 对 基本 表 的 更 新 : 


DELETE 

FROM Student 

WHERE Sno = '1703070110'AND Sdept = ' 信 息 学 院 '; 

同样 ,这 里 系统 自动 将 所 属 学 院 名 ' 信 息 学 院 ' 放 入 WHERE 子 句 中 。 

在 关系 数据 库 中 ,并 非 所 有 的 视图 都 是 可 更 新 的 ,因为 有 些 视图 的 更 新 不 能 唯一 有 意义 
地 转换 成 对 相应 基本 表 的 更 新 。 

如 果 想 把 例 80 视图 S_G 中 学 号 为 1703070101 的 学 生 的 平均 成 绩 改 成 90 分 ,SQL 语 
句 如 下 : 

UPDATE S_G 

SET Gavg = 90 

WHERE Sno = '1703070101'; 

前 面 在 例 80 定义 的 视图 S_G 是 由 学 号 ,总 成 绩 以 及 平均 成 绩 三 个 属性 列 组 成 的 ,其 中 
总 成 绩 和 平均 成 绩 二 项 是 由 SC 表 中 对 元 组 分 组 后 计算 成 绩 以 及 平均 成 绩 得 来 的 。 若 想 把 
视图 中 某 学 生 的 平均 成 绩 改 成 90 分 , 则 对 该 视图 的 更 新 是 无 法 转换 成 对 基本 表 SC 的 更 新 
的 。 因 为 系统 无 法 修改 该 生 各 科 成 绩 。 以 使 其 平均 成 绩 成 为 90, 所 以 S_G 视图 是 不 可 更 
新 的 。 

一 般 地 ,行列 子 集 视图 是 可 以 更 新 的 。 除 行列 子 集 视图 外 ,还 有 些 视图 理论 上 是 可 更 新 
的 ,但 它们 的 确切 特征 还 是 尚 待 研究 的 课题 。 还 有 些 视图 从 理论 上 就 是 不 可 更 新 的 。 

目前 各 个 关系 数据 库 系 统一 般 都 只 允许 对 行列 子 集 视图 进行 更 新 ,而 且 各 个 系统 对 视 
图 的 更 新 还 有 更 进一步 的 规定 ,由 于 各 系统 实现 方法 上 的 差异 ,这 些 规定 也 不 尽 相 同 。 

例如 DB2 规定 (其 他 也 有 类 似 的 规定 ) : 

@ 若 视图 是 由 两 个 以 上 基本 表 导 出 的 , 则 此 视图 不 允许 更 新 ; 

@ 若 视图 的 列 来 自 表 达 式 或 常数 , 则 不 允许 对 此 视图 执行 INSERT 和 UPDATE 操 
作 , 但 允许 执行 DELETE 操作 ; 

@ 视图 的 列 来 自 聚集 函数 , 则 此 视图 不 允许 更 新 ; 

@ 如 果 视 图 的 定义 中 含有 GROUP BY 子 句 , 则 此 视图 不 允许 更 新 ; 

@ 如 果 视 图 的 定义 中 含有 DISTINCT 短语 , 则 此 视图 不 允许 更 新 ; 

如 果 视 图 的 定义 中 有 髓 套 查 询 , 并 且 内 层 查 询 的 FROM 子 句 中 涉及 的 表 也 是 导出 
该 视图 的 基本 表 , 则 此 视图 不 允许 更 新 ; 

【 例 89】 将 成 绩 在 平均 成 绩 之 上 的 元 组 定义 成 一 个 视图 Good_S_C。 


CREATE VIEW Good S_C 
RS 


SELECT Sno，Cno, Grade 

FROM SC 

WHERE Grade > 

( SELECT AVG (grade ) 
FROM SC); 


导出 视图 Good_S_C 的 基本 表 是 SC, 内 层 查 询 中 涉及 的 表 也 是 SC, 所 以 视图 Good_S_ 
C 是 不 允许 更 新 的 。 

@ 一 个 不 允许 更 新 的 视图 上 定义 的 视图 也 不 允许 更 新 。 

应 该 指出 的 是 ,不 可 更 新 的 视图 与 不 允许 更 新 的 视图 是 两 个 不 同 的 概念 ,前 者 指 理论 上 
已 证 明 其 是 不 可 更 新 的 视图 。 后 者 指 实际 系统 中 不 支持 其 更 新 ,但 它 本 身 有 可 能 是 可 更 新 
的 视图 。 


3.6 查询 优化 


在 数据 库 系 统 中 ,最 基本 、 最 常用 和 最 复杂 的 数据 操作 是 数据 查询 。SQL 语言 作为 一 
种 描述 性 语言 ,并 没有 给 出 关于 查询 执行 方法 的 建议 ,因此 查询 首先 要 被 DBMS 解析 ,解析 
后 不 得 不 被 转化 成 关系 代数 表达 式 。 而 对 于 同一 个 查询 要 求 ,通常 可 对 应 多 个 不 同形 式 化 
相互 等 价 的 关系 代数 表达 式 。 这 样 ,相同 的 查询 要 求 和 结果 存在 不 同 的 实现 策略 ,系统 在 执 
行 这 些 查 询 策 略 时 所 付出 的 开销 会 有 很 大 差别 。 从 查询 的 多 个 执行 策略 中 进行 合理 选择 的 
过 程 就 是 “查询 处 理 过 程 中 的 优化 ”, 简 称 为 查询 优化 。 

在 关系 数据 库 系 统 中 ,以 关系 数据 理论 为 基础 ,建立 起 由 系统 通过 机 器 自动 完成 查询 优 
化 工作 的 有 效 机 制 , 这 种 机 制 最 为 引 人 注 目的 结果 就 是 : 关系 数据 库 查 询 语 言 可 以 设计 成 
非 过 程 化 的 。 用 户 只 需要 向 系统 表述 “做 什么 ”, 而 不 需要 说 明 “ 怎 么 做 ”。 查 询 处 理 和 查询 
优化 过 程 的 具体 实施 完全 由 系统 自动 完成 。 正 是 在 这 种 意义 上 ,人 们 称 关 系数 据 查 询 语 言 
为 非 过 程 化 查询 语言 。 

本 节 首 先 介绍 关系 数据 库 管理 系统 的 查询 处 理 (Query Processing) 步 又 ,然后 介绍 查询 
优化 (Query Optimization) 技 术 。 查 询 优化 一 般 可 分 为 代数 优化 (也 称 为 逻辑 优化 ) 和 物理 
优化 (也 称 为 非 代数 优化 ) 。 代 数 优化 是 指 关 系 代 数 表达 式 的 优化 ,物理 优化 则 是 指 通过 存 
取 路 径 和 底层 操作 算法 的 选择 进行 的 优化 。 

查询 优化 作为 DBMS 的 关键 技术 ,对 于 数据 库 的 性 能 需求 和 实际 应 用 有 着 重要 的 


3.6.1 查询 处 理 的 步骤 


在 关系 数据 库 系统 中 ,查询 处 理 的 任务 是 将 客户 端 提 交 给 系统 的 SQL 语句 转换 为 可 执 
行 的 、 高 效率 的 查询 执行 计划 ,然后 执行 该 计划 ,并 返回 查询 结果 。 

用 户 对 查询 处 理 的 过 程 是 不 关心 的 ,用 户 提 交 SQL 语句 之 后 便 等 待 获得 查询 结果 。 与 
之 相反 ,关系 数据 库 系统 查询 处 理 所 关注 的 正 是 由 SQL 语句 求 出 查询 结果 的 全 过 程 。 在 关 
系数 据 库 系统 中 ,查询 处 理 可 分 为 4 个 阶段 : 查询 分 析 、 查 询 检 查 、 查 询 优 化 和 查询 执行 ,如 
图 3-4 所 示 。 


关系 数据 亩 标准 语言 SQL 


地 ww 由 


数据 庄原 理 及 应 用 教程 一 -SQL Server 2014 


查询 分 析 查询 检查 
查询 语句 记分 析 | 三 解析 村 | | 和 村 ) 
查询 语句 。 。| 记 | | -| 完整 性 检查 | -| 坦 i 
SQL 语法 分 析 1 (parser tree) | 安全 仁 检 查 1 (query tree) | 
0 符号 名 转换 | 
查询 执行 查询 优化 
1 查询 计划 的 1 1 查询 执行 计划 1 代数 优化 
| 执行 代码 “站 | 代码 生成 1(Execution plan) | 物理 优化 


图 3-4 查询 处 理 的 步骤 


1. 查询 分 析 

首先 对 合法 的 查询 语句 进行 扫描 ,从 SQL 查询 语句 字符 串 中 识别 出 语言 符号 , 即 根据 
数据 字典 中 有 关 的 模式 定义 检查 语句 中 的 数据 库 对 象 ,如 SQL 标识 符 、 数 字 、 运 算 符 、 关 系 
名 、 属 性 名 进行 语法 检查 和 语法 分 析 , 即 判断 查询 语句 是 否 符合 SQL 语法 规则 。 如 果 没 有 
语法 错误 ,符合 规则 的 SQL 语句 为 其 生成 相应 的 解析 树 ( 又 称 语法 树 ) ,否则 便 报告 语句 中 
出 现 的 语法 错误 并 返回 。 

2. 查询 检查 

根据 数据 字典 中 模式 的 上 文 ,对 解析 树 进行 语义 检查 , 即 检查 SQL 语句 中 出 现 的 数据 
库 对 象 ( 如 关系 名 、 属 性 名 、 视 图 名 等 ) ,是否 存在 和 是 否 有 效 。 如 果 是 对 视图 的 操作 , 则 要 用 
视图 消解 方法 把 对 视图 的 操作 转换 成 对 基本 表 的 操作 。 然 后 根据 数据 字典 中 用 户 权限 和 完 
整 性 约束 的 定义 ,对 SQL 语句 的 存储 权限 及 是 否 违反 安全 性 和 完整 性 约束 进行 检查 。 如 果 
该 用 户 没有 相应 的 访问 权限 或 违反 了 完整 性 约束 ,就 拒绝 执行 该 查询 。 

检查 通过 后 便 把 SQL 查询 语句 转换 成 内 部 表示 , 即 等 价 的 关系 代数 表达 式 。 这 个 过 程 
中 要 把 数据 库 对 象 的 外 部 名 称 转换 为 内 部 表示 。 对 于 通过 检查 的 解析 树 ,将 其 转换 为 查询 
树 (Query Tree) 来 表示 扩展 的 关系 代数 表达 式 ,其 节点 为 关系 代数 运算 符 。 如 果 解 析 树 没 
有 通过 上 述 检查 , 则 向 用 户 报告 错误 并 返回 。 

3. 查询 优化 

由 于 关系 代数 具有 等 价 变换 规则 ,加 之 不 同 存 取 方法 和 执行 算法 的 代价 不 同 , 每 个 查询 
都 会 有 许多 可 供 选择 的 执行 策略 和 操作 算法 ,查询 优化 就 是 选择 一 个 高 效 执行 的 查询 处 理 
策略 。 查 询 优化 有 多 种 方法 。 按 照 优化 的 层次 一 般 可 将 查询 优化 分 为 代数 优化 和 物理 优 
化 。 代 数 优化 是 指 关 系 代数 表达 式 的 优化 ,按照 关系 代数 的 等 价 规则 对 关系 代数 表达 式 进 
行 等 价 变换 ,改变 代数 表达 式 中 操作 的 次 序 和 组 合 , 使 查询 执行 更 高 效 。 物 理 优化 则 是 基于 
规则 (Rule Based) 的 、 基 于 代价 (Cost Based) 的 或 基于 语义 (Semantic Based) 来 选择 数据 存 
取 路 径 和 底层 执行 算法 ,使 查询 效率 达到 最 优 或 近似 最 优 。 实 际 关 系数 据 库 管理 系统 中 的 
查询 优化 器 都 综合 运用 了 这 些 优 化 技术 ,以 获得 最 好 的 查询 优化 效果 。 

在 实际 的 RDBMS 中 ,查询 优化 器 往往 综合 运用 多 种 优化 技术 ,可 以 说 它 是 查询 处 理 引 
擎 中 复杂 度 最 高 的 模块 。 查 询 优化 步骤 以 查询 树 作 为 输入 ,得 到 经 过 优化 的 查询 执行 计划 ， 
一 般 执 行 计划 也 采用 树 形 结构 , 树 节点 是 为 某 关 系 运算 符 指 定 的 执行 算法 或 存 取 路 径 。 

4. 查询 执行 

依照 查询 执行 计划 调用 为 关系 运算 符 指定 的 算法 和 存 取 路 径 ,将 中 间 结 果 存 放 到 缓冲 


区 中 ,最 后 将 最 终 查 询 结果 返回 给 客户 端 。 
3.6.2 查询 执行 算法 


每 一 种 关系 代数 运算 符 都 有 多 种 执行 算法 ,本 节 简 要 介绍 选择 运算 和 连接 运算 的 算法 
思想 及 其 实现 算法 。 这 里 仅仅 介绍 最 主要 的 几 个 算法 ,对 于 其 他 重要 操作 的 详细 实现 算法 ， 
有 兴趣 的 读者 请 参阅 RDBMS 实现 技术 方面 的 书籍 。 

1. 选择 操作 的 实现 

是 针对 一 个 关系 表 进 行 的 。 任 何 关 系 都 可 以 通过 顺序 扫描 实现 选择 运算 。 

本 章 的 前 部 分 ,重点 介绍 了 SELECT 语句 的 强大 功能 ,SELECT 语句 有 许多 选项 ,因此 
实现 的 算法 和 优化 策略 也 很 复杂 。 不 失 一 般 性 ,下 面 以 简单 的 选择 操作 为 例 介绍 典型 的 实 
现 方法 。 

【 例 90】 

SELECT * 

FROM Student 

WHERE < 条 件 表达 式 >; 

我 们 首先 考虑 < 条 件 表达 式 > 的 几 种 情况 : 

Cl: 无 条 件 ; 

C2: Sno 一 '1703070101'; 

C3: Sage=18; 

C4: Sdept= ' 信 息 学 院 ' AND Sage<<18， 

由 于 选择 操作 只 涉及 一 个 关系 表 进 行 ,一 般 采 用 全 表 扫 描 或 者 基于 索引 的 算法 。 

(1) 简单 的 全 表 扫 描 算 法 (Table Scan) 

假设 可 以 使 用 的 内 存 为 M 块 ,全 表 扫 描 的 算法 思想 如 下 : 

按照 物理 次 序 读 Student 的 M 块 到 内 存 。 

Oy 逐一 检查 每 个 元 组 是 否 满足 选择 条 件 ,将 满足 条 件 的 元 组 作为 查询 结果 输出 。 

@ 如 果 Student 还 有 其 他 块 未 被 处 理 , 重 复 和 @，。 

全 表 扫 描 算法 只 需要 很 少 的 内 存 ( 最 少 为 1 块 ) 就 可 以 运行 ,而 且 控制 简单 。 如 果 关 系 
表 中 元 组 的 数量 较 少 ( 几 百 条 或 几 千 条 ) , 则 顺序 扫描 可 以 简单 .高效 地 实现 选择 运算 。 但 对 
于 元 组 数量 较 多 ( 儿 十 万 条 、 儿 百 万 条 ) 的 大 规模 关系 表 , 且 选择 率 ( 即 满足 条 件 的 元 组 数 占 
全 表 的 比例 ) 较 低 时 ,顺序 扫描 的 效率 很 低 。 

如 果 选 择 条 件 与 关系 上 建立 的 索引 匹配 ,可 以 使 用 索引 快速 查找 满足 条 件 的 元 组 指针 
或 元 组 主 码 ,进而 通过 元 组 指针 直接 在 基本 表 中 定位 元 组 。 如 果 关 系 表 的 规模 较 大 而 选择 
运算 结果 元 组 个 数 占 表 中 元 组 总 个 数 的 比例 又 较 小 , 则 使 用 索引 扫描 会 获得 较 高 的 效果 。 

(2) 索引 扫描 算法 (Index Scan) 

如 果 选 择 条 件 中 的 属性 上 有 索引 (例如 B 十 树 索引 或 Hash 索引 ) ,可 以 用 索引 扫描 方 
法 ,通过 索引 先 找到 满足 条 件 的 元 组 指针 ,再 通过 元 组 指针 在 查询 的 基本 表 中 找到 元 组 。 

还 以 例 90 为 例 说 明 索 引 扫描 算法 。 

@ 以 C2 为 例 : Sno 二 '1703070101' 为 等 值 比较 ,并 且 Sno 上 有 索引 , 则 可 以 使 用 索引 得 
到 Sno 为 '1703070101' 元 组 的 指针 ,然后 通过 元 组 指针 在 Student 表 中 检索 到 该 学 生 元 组 。 
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对 于 等 值 比较 ,使 用 Hash 索引 ( 即 散 列表 ) 的 效率 要 高 于 使 用 B 十 树 索引 的 效率 。 

@ 以 C3 为 例 : Sage 二 18 为 范围 查找 ,如 果 属 性 Sage 上 有 B 十 树 索引 , 则 可 以 以 此 为 
入 口 点 使 用 该 B 十 树 索引 找到 Sage 一 18 的 所 有 元 组 指针 ,然后 通过 该 元 组 指针 到 Student 
表 中 定位 相应 年 龄 小 于 18 岁 的 所 有 学 生 元 组 。 注意, Hash 索引 只 支持 等 值 比较 而 不 支持 
范围 查找 ,B 十 树 索 引 既 支持 等 值 比较 又 支持 范围 查找 。 

@ 以 C4 为 例 Sdept= ' 信 息 学 院 'AND Sage 二 18, 如 果 Sdept 和 Sage 上 都 有 索引 ,一 种 
算法 是 ,分 别 用 上 面 两 种 方法 找到 Sdept= ' 信 息 学 院 ' 的 一 组 元 组 指针 和 Sage 二 18 的 另 一 
组 元 组 指针 , 求 这 两 组 指针 的 交集 ,再 到 Student 表 中 检索 ,就 得 到 信息 学 院 且 年 龄 小 于 18 
岁 的 学 生 。 

另 一 种 算法 是 ,如 果 属 性 Sdept 上 有 B 十 树 索 引 , 则 使 用 Sdep 上 的 B 十 树 索 引 找 到 
Sdept= ' 信 息 学 院 ' 的 所 有 元 组 指针 ,通过 这 些 元 组 指针 到 Student 表 中 检索 相应 的 学 生 元 
组 ,并 对 得 到 的 元 组 检查 另 一 些 选择 条 件 Sage 一 18 是 否 满足 ,将 满足 条 件 的 元 组 作为 查询 
结果 输出 。 

一 般 情 况 下 ,当选 择 率 较 低 时 ,基于 索引 的 选择 算法 要 优 于 全 表 扫 描 算法 。 但 在 某 些 情 
况 下 ,例如 选择 率 较 高 ,或 者 要 查找 的 元 组 均匀 地 分 布 在 查找 的 表 中 ,这 时 基于 索引 的 选择 
算法 的 性 能 不 如 全 表 扫 描 算 法 。 因 为 除了 对 表 的 扫描 操作 ,还 要 加 上 对 B 十 树 索 引 的 扫描 
操作 ,对 每 一 个 检索 码 , 从 B 十 树 根 节点 到 叶子 节点 路 径 上 的 每 个 节点 都 要 执行 一 次 I/O 操 
作 。 索 引 的 扫描 操作 每 一 个 检索 码 , 从 B 十 树 根 节 点 到 叶子 节点 路 径 上 的 每 个 节点 都 要 执 
行 一 次 7O 操作 。 

2. 连接 操作 的 实现 

连接 运算 是 一 种 二 元 运算 , 它 涉及 两 个 或 者 两 个 以 上 的 关系 表 。 连 接 操 作 也 是 查询 处 
理 中 最 常用 也 是 最 耗 时 的 操作 之 一 。 人 们 对 它 进 行 了 深入 的 研究 ,提出 了 一 系列 的 算法 。 
不 失 一 般 性 ,这 里 通过 例子 简单 介绍 等 值 连接 (或 自然 连接 ) 最 常用 的 几 种 算法 思想 。 

下 面 以 等 值 连接 为 例 , 讨 论 实 现 连 接 运算 的 4 种 常用 算法 : 嵌 套 循环 算法 .排序 -合并 
算法 、 索 引 连 接 算法 .Hash Join 算法 。 

【 例 91】 

SELECT * 

FROM Student 

WHERE Student. Sno = SC. Sno; 

解 题 说 明 : 

这 是 一 个 内 连接 查询 ,其 中 ,Student 为 左 表 ,SC 为 右 表 。 

(1) 髓 套 循环 算法 (Nested Loop Join) 

这 是 最 简单 可 行 的 算法 。 对 左 表 (Student 表 ) 的 每 一 个 元 组 ,算法 都 扫描 右 表 (SC 表 ) 
的 全 部 元 组 中 的 每 一 个 元 组 ,并 检查 这 两 个 元 组 在 连接 属性 (Sno) 上 是 否 相 等 。 如 果 满 足 
连接 条 件 , 则 串 接 后 作为 结果 输出 ,直到 左 表 中 的 元 组 处 理 完 为 止 。 实 际 上 , 嵌 套 循环 连接 
相当 于 二 重 循环 。 这 里 讲 的 是 算法 思想 ,在 实际 实现 中 数据 存 取 是 按照 数据 块 读 人 内存, 而 
不 是 按照 元 组 进行 1/O 的 。 骨 套 循环 算法 是 最 简单 .最 通用 的 连接 算法 ,可 以 处 理 包括 非 
等 值 连接 在 内 的 各 种 连接 操作 。 但 是 对 于 规模 较 大 的 表 , 它 的 执行 效率 较 低 。 

如 果 在 右 表 的 Sno 属性 上 已 建立 了 索引 , 则 可 用 左 表 当 前 元 组 的 Sno 属性 值 作 关键 字 


查找 右 表 的 索引 ,以 获得 右 表 中 相应 的 元 组 .利用 索引 可 以 避免 每 次 都 扫描 右 表 的 全 部 
元 组 。 

(2) 排序 -合并 算法 (Sort-merge Join 或 Merge Join) 

这 是 等 值 连接 常用 的 算法 ,尤其 适合 参与 连接 的 诸 表 已 经 排 好 序 的 情况 。 

用 排序 -合并 连接 算法 的 步骤 是 : 

@ 如 果 参 与 连接 的 表 没 有 排 好 序 ,首先 对 左 表 Student 表 和 右 表 SC 表 按 连接 属性 Sno 
的 升序 排序 。 

@ 取 左 表 Student 表 中 第 一 个 元 组 作为 当前 元 组 ,从 右 表 的 第 一 个 元 组 开始 扫描 ,将 
左 表 当前 Sno 值 与 右 表 Sno 值 相等 的 元 组 连接 起 来 ; 依次 扫描 SC 表 中 具有 相同 Sno 的 元 
组 ,把 它们 连接 起 来 。 

@ 当 扫 到 右 表 中 第 一 个 大 于 左 表 当前 Sno 值 的 元 组 时 ,停止 对 右 表 扫 描 , 返 回 左 表 取 
下 一 个 元 组 作为 当前 元 组 ,从 上 次 停止 扫描 的 位 置 开始 继续 对 右 表 进行 扫描 ,将 左 表 当前 
Sno 值 与 右 表 Sno 值 相等 的 元 组 连接 起 来 。 
重复 上 述 步 骤 , 直 到 左 表 中 全 部 元 组 扫描 完毕 。 

在 该 算法 中 ,由 于 左 表 和 右 表 都 是 按照 连接 字段 排 好 序 的 ,因此 两 表 均 只 需 扫 描 一 遍 即 
可 。 当 然 , 如 果 两 个 表 原 来 无 序 , 执 行 时 间 要 加 上 对 两 个 表 的 排序 时 间 。 一 般 来 说 ,对 于 大 
表 , 先 排序 后 使 用 排序 -合并 连接 算法 执行 ,总 的 。。 sadent eG 
时 间 一 般 仍 会 减少 ,归并 连接 的 效率 仍然 是 很 高 1703070101 ES 1703070101 


的 。 归 并 连接 算法 非常 适合 于 没有 索引 的 两 个 | 上 2050702 oT 

_ 1703070120 1703070101 
较 大 规模 表 的 连接 运算 。 归 并 连接 算法 的 过 程 | [703070155 1703070211 
如 图 3-5 所 示 。 1703070211 


(3) 索引 连接 (Index Join) 算 法 

用 索引 连接 算法 的 步 又 是 : 

@ 在 右 表 SC 表 上 已 经 建立 对 属性 Sno 的 索引 。 

@ 对 左 表 Student 中 每 一 个 元 组 ,由 Sno 值 通过 SC 的 索引 查找 相应 的 SC 元 组 。 

@ 把 这 些 SC 元 组 和 Student 元 组 连接 起 来 。 

循环 执行 @G) ,直到 左 表 Student 表 中 的 元 组 处 理 完 为 止 。 

(4) Hash Join 算法 

Hash Join 算法 是 处 理 等 值 连接 和 自然 连接 的 算法 。 在 该 算法 中 ,用 Hash 函数 划分 两 
个 关系 的 元 组 。 该 算法 的 基本 思想 是 把 每 个 关系 的 元 组 划分 在 连接 属性 值 上 具有 相同 属性 
值 的 元 组 集合 。 

在 Hash 连接 算法 中 ,首先 扫描 一 遍 右 表 SC 表 . 用 连接 字段 Sno 作为 Hash 关键 字 ,将 
右 表 的 全 部 元 组 散 列 到 位 于 内 存 的 Hash 表 中 ; 然后 顺序 扫描 左 表 Student 表 , 用 左 表 当 前 
元 组 的 Sno 值 作为 Hash 关键 字 ,在 内 存 Hash 表 中 定位 到 相应 的 右 表 元 组 ,其 中 有 一 部 分 
元 组 的 Sno 值 与 左 表 当前 元 组 的 Sno 值 相等 ,将 左 表 当前 元 组 与 这 部 分 元 组 连接 起 来 。 
此 , 左 表 和 右 表 也 只 需 扫 描 一 遍 ,加 之 内 存 Hash 表 的 查找 代价 可 忽略 不 计 , 使 得 算法 执行 
效率 较 高 。 

以 上 的 算法 思想 可 以 推广 到 更 加 一 般 的 多 个 表 的 连接 算法 上 。 许 多 改进 的 算法 请 相关 
参考 文献 。 


图 3-5 排序 -合并 连接 算法 示意 图 
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3.6.3 查询 优化 的 一 般 策 略 


当前 ,一 般 系统 都 是 选用 代数 优化 方法 。 这 种 方法 与 具体 关系 系统 的 存储 技术 无 关 。 
其 基本 原理 是 研究 如 何 对 查询 代数 表达 式 进行 适当 的 等 价 变换 , 即 如 何 安排 所 涉及 的 操作 
的 先后 执行 顺序 。 其 基本 原则 是 尽量 减少 查询 过 程 中 的 中 间 结 果 , 从 而 以 较 少 的 时 间 和 空 
间 执 行 , 取 得 所 需 的 查询 结果 。 

下 面 是 提高 查询 效率 的 常用 优化 策略 。 

1. 选择 和 投影 运算 尽早 执行 

选择 运算 应 尽 可 能 先 作 ,在 优化 策略 中 这 是 最 重要 ,最 基本 的 一 条 。 它 常常 可 使 执行 时 
间 节 约 几 个 数量 级 ,因为 选择 或 投影 运算 常常 可 以 使 计算 的 中 间 结 果 大 大 变 小 。 由 于 选择 
运算 可 能 大 大 减少 元 组 的 数量 ,同时 选择 运算 还 可 以 使 用 索引 存 取 元 组 ,所 以 通常 认为 选择 
操作 应 当 优先 于 投影 操作 。 

2. 把 某 些 选择 操作 与 邻接 的 笛 卡 儿 积 相 结合 ,形成 一 个 连接 操作 

把 要 执行 的 笛 卡 儿 积 与 在 它 后 面 要 执行 的 选择 结合 起 来 成 为 一 个 连接 运算 ,连接 (特别 
是 等 值 连接 ) 运 算 要 比 同样 关系 上 的 笛 卡 儿 积 省 很 多 时 间 。 

opra>sc(RXS)= REIS 

等 式 前 是 先 做 笛 卡 儿 积 ,再 做 选择 运算 ,要 对 表 进 行 两 次 扫描 ; 等 式 后 是 在 两 表 中 选 出 
符合 条 件 元 组 的 同时 进行 连接 ,对 两 表 各 扫描 一 遍 即 可 完成 。 另 外 ,相同 关系 上 的 连接 操 
作 , 特 别 是 等 值 连接 操作 远 比 第 卡 儿 积 节 省 时 间 。 

3. 同时 执行 相同 关系 上 多 个 选择 运算 和 投影 操作 

同时 进行 投影 运算 和 选择 运算 。 如 有 若干 投影 和 选择 运算 ,并 且 它 们 都 对 同一 个 关系 
操作 , 则 可 以 在 扫描 此 关系 的 同时 完成 所 有 这 些 运算 以 避免 重复 扫描 关系 。 

例 : [soo (GGmae=90《SC) ) 执 行 时 ,在 选 出 成 绩 大 于 90 分 元 组 的 同时 进行 学 号 的 投影 , 则 
对 SC 表 扫 描 一 次 即 可 完成 。 

4. 让 投影 运算 与 其 邻近 的 操作 结合 起 来 同时 执行 

把 投影 同 其 前 或 其 后 的 双 目 运算 结合 起 来 ,这 样 可 以 节省 为 单独 完成 投影 操作 而 进行 
的 关系 扫描 。 

例 : 

JIs。(S1 — S2)\S1 D4 Ilsw (S2) 

以 上 两 操作 均 仅 对 表 扫 描 一 遍 即 可 完成 。 

5. 在 执行 连接 前 对 关系 适当 地 预 处 理 

预 处 理 方法 主要 有 两 种 方法 : 索引 连接 方法 ,排序 合并 连接 方法 。 

索引 连接 方法 是 先 在 关系 的 连接 属性 上 建立 索引 ,然后 执行 连接 。 

排序 合并 连接 方法 是 先 对 关系 按 连 接 属 性 进行 排序 ,再 执行 连接 。 

设 R.S 如 图 3-6 所 示 ,应 用 排序 合并 连接 方法 的 自然 连接 ,需要 对 二 个 表 进 行 扫描 , 且 
各 只 扫描 一 遍 即 可 ,但 必须 首先 对 要 连接 的 表 进 行 排序 。 一 般 自 然 连接 R、S 的 扫描 的 时 间 
复杂 度 需 OCm x n) ,而 用 该 方法 的 时 间 复 杂 度 仅 需 OGm 十 n) 。 

6. 找 出 公共 子 表达 式 

如 果 一 个 反复 出 现 的 公共 表达 式 结果 不 是 一 个 很 大 的 关系 ,而 且 从 外 存 中 读 入 它 时 间 


Student SC 


Sno Sname 2 Sno Cno Grade 
1703070101| 地 艺 1703070101 | 03001 90 
1703070211| 王 一 1703070101 | 03002 87 
1703070120| 张 欣 1703070101 | 03003 72 
1703070125| 吴 波 1703070211 | 03001 85 
1703070302| 何 穗 1703070211 | 03002 62 
1703070125 | 03002 70 


LA 


图 3-6 排序 -合并 连接 方法 示例 


小 于 计算 该 子 表 达 式 的 时 间 , 则 先 计算 一 次 公共 子 表达 式 并 把 结果 写 入 中 间 文 件 是 合算 的 。 
当 查 询 视图 时 ,公共 表达 式 是 经 常 出 现 的 。 一 个 程序 通常 包含 多 个 查询 ,这 些 查 询 可 能 包含 
多 个 公共 表达 式 。 

当 给 定 一 个 关系 表达 式 , 可 以 使 用 上 面 的 查询 优化 的 策略 对 这 个 表达 式 进 行 等 价 变换 ， 
产生 一 个 具有 较 高 效率 的 等 价 表 达 式 。 但 是 要 注意 的 是 ,这 些 策略 不 能 保证 一 定 产生 最 优 
化 的 等 价 表达 式 。 

有 关 查 询 处 理 和 查询 优化 的 详细 内 容 , 感 兴趣 的 读者 可 阅读 RDBMS 实现 技术 方面 的 
书籍 ,在 此 不 作 过 多 介绍 。 


3.7 小 结 


SQL 是 关系 数据 库 的 标准 语言 ,是 介 于 关系 代数 和 元 组 演算 之 间 的 高 度 非 过 程 化 ,用 
于 交互 式 的 一 种 结构 化 、 非 过 程 化 且 进 行 了 过 程 化 扩展 的 查询 语言 。SQL 是 一 种 声明 式 语 
言 ,不 同 于 传统 的 命令 式 编程 语言 ,使 用 SQL 只 需要 描述 “做 什么 ”, 而 无 须 具体 指明 “怎么 
做 ”。SQL 支持 数据 库 系 统 的 3 级 模式 结构 。 

SQL 的 核心 功能 由 数据 定义 语言 (DDL)、 数 据 操纵 语言 (DML) 和 数据 控制 语言 
(DCL) 三 个 部 分 组 成 。 有 时 候 把 设计 更 新 称 为 数据 操纵 ,或 把 设计 查询 与 数据 更 新 合 称 为 
数据 操纵 。 本 章 系统 地 介绍 了 这 三 部 分 的 内 容 。 

一 个 使 用 SQL 语言 的 数据 库 是 表 、 视 图 等 的 集合 , 它 由 一 个 或 多 个 SQL 模式 来 定义 。 
用 SQL 可 以 定义 和 删除 所 需 的 模式 、 数 据 库 表 、 视 图 以 及 索引 ; 数据 查询 是 SQL 的 核心 。 
声明 式 的 SELECT 语句 提供 了 全 面 的 数据 查询 功能 ,并 对 数据 库 中 数据 进行 各 种 查询 和 更 
新 操作 。 包 括 各 种 用 于 查询 数据 库 的 语言 结构 ,不 仅 能 进行 单 表 查询 ,还 能 进行 多 表 的 连接 
的 查询 、 典 套 查询 和 集合 查询 ,并 能 对 查询 结果 进行 统计 、 计 算 、 分 组 和 排序 等 。 本 章 讲解 了 
SELECT 语句 的 各 种 用 法 。 

SQL 中 的 数据 操纵 语言 用 于 更 新 指定 的 数据 ,包括 插入 新 数据 (INSERT) 修改 已 有 数 
据 (UPDATE) 以 及 删除 数据 (DELETE) 。 

在 SQL 中 ,定义 视图 是 设计 数据 库 外 模式 的 基本 手段 。 视 图 是 存储 在 数据 库 查询 定义 
的 虚拟 表 。 数 据 库 中 只 存放 视图 的 定义 ,不 存放 视图 对 应 的 数据 ,数据 仍 存放 在 导出 视图 的 
基本 表 中 。 视 图 有 简化 数据 查询 、 保 持 数据 独立 性 、 提 供 数据 安全 性 等 优点 。 本 章 介绍 了 如 
何 定义 视图 ` 如 何 查询 视图 .如 何 更 新 视图 以 及 更 新 视图 的 一 些 限制 。 
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最 后 简单 介绍 了 查询 优化 的 基本 概念 。 
习 题 


一 、 简 答题 
1. SQL 模式 、 基 本 表 、 视 图 、 相 关子 查询 、 外 连接 、 查 询 优化 。 
2. SQL 语言 是 一 种 什么 语言 ? 简 述 SQL 语言 的 核心 功能 由 哪些 部 分 组 成 ,其 特点 是 


3. 简 述 视图 与 表 有 何不 同 ? 视图 有 哪些 用 途 ? 

4. 简 述 WHERE 子 句 与 HAVING 短语 的 区 别 。 

5. 所 有 视图 是 否 都 可 以 更 新 ? 为 什么 ? 

6. 根据 关系 代数 写 出 SQL 语句 : 

(1) Hs (ew va00r (SC))S 

(2) GGrade<100N Grade>90 ( SO); 

(3) Ilsnwme (OGrade>90 (SC)oo(Student) ) 。 

二 、 试用 SQL 查询 语句 表达 下 列 对 教学 数据 库 3 个 基本 表 S.C、SC 的 查询 。 

S(S#, SNAME ,AGE, SEX) 

C(C#, CNAME TEACHER) 

SC(S#, C#, GRADE) 

1. 在 表 C 中 统计 开设 课程 的 教师 人 数 。 

2. 求 选修 C4 课程 的 女 学 生 的 平均 年 龄 。 

3. 求 每 个 学 生 选 修 课 程 ( 已 有 成 绩 ) 的 门 数 和 平均 成 绩 。 

4. 统计 每 个 学 生 选 修 课 程 的 门 数 (超过 5 门 的 学 生 才 统计 )。 要 求 输出 学 生 学 号 和 选 
修 门 数 ,查询 结果 按 门 数 降序 排列 , 若 门 数 相同 , 按 学 号 升序 排列 。 
. 检索 学 号 比 WANG 同学 大 ,而 年 龄 比 他 小 的 学 生 姓 名 。 
. 查询 每 个 学 生 及 其 选修 的 课程 名 其 及 成 绩 。 

7. 检索 姓名 以 工 开头 的 所 有 学 生 的 姓名 和 年 龄 。 

8. 检索 年 龄 大 于 女 同 学 平均 年 龄 的 男 学 生 姓名 和 年 龄 。 

9. 检索 年 龄 大 于 所 有 女 同学 年 龄 的 男 学 生 的 姓名 和 年 龄 。 

10. 查询 选修 2 号 课程 且 成 绩 在 90 分 以 上 的 所 有 学 生 。 

三 、 试用 SQL 更 新 语句 对 上 题 中 的 3 个 基本 表 进 行 更 新 操作 。 

1. 向 基本 表 S 中 插入 一 个 学 生 记 录 ('1704110101','zhang',17,' 女 '); 

2. 在 S 表 中 检索 每 一 门 课程 成 绩 都 大 于 等 于 80 分 的 学 生 学 号 、 姓 名 和 性 别 , 并 把 检索 
的 信息 送 到 另 一 个 已 存在 的 基本 表 STUDENT(S# ,SNAME,SEX) 中 。 

3. 在 SC 中 删除 尚 无 成 绩 的 选课 记录 。 

4. 把 WANG 同学 的 选课 记录 全 部 删除 。 
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第 4 章 关系 模式 的 规范 化 设计 理论 


【本 章 主要 内 容 】 

1. 通过 实例 简 述 关系 模式 规范 化 设计 的 必要 性 。 

2. 介绍 关系 模式 中 函数 依赖 及 多 值 依赖 的 相关 概念 。 

3. 介绍 关系 模式 的 范式 的 相关 概念 。 

4. 详细 阐述 关系 模式 的 规范 化 过 程 。 

5. 介绍 关系 模式 分 解 的 理论 基础 并 讨论 关系 模式 分 解 的 算法 。 

本 书 前 儿童 讨论 了 数据 库 系 统 的 一 般 概念 ,介绍 了 关系 数据 库 、 关 系 模型 的 基本 概念 以 
及 关系 数据 库 的 标准 语言 SQL, 接 下 来 将 讨论 关系 数据 库 设计 的 相关 问题 。 本 章 讲 述 的 关 
系 模式 的 规范 化 设计 理论 是 数据 库 设 计 的 理论 指南 ,研究 关系 模式 中 各 属性 之 间 的 数据 依 
赖 关系 及 其 对 关系 模式 性 能 的 影响 ,提供 判断 关系 模式 规范 化 程度 的 理论 标准 ,讨论 关系 模 
式 规范 化 的 方法 及 关系 模式 分 解 的 算法 。 

本 董 主要 介绍 函数 依赖 的 有 关 概 念 ,第 一 范式 、 第 二 范式 ,第 三 范式 、BC 范式 及 第 四 范 
式 的 定义 ,重点 分 析 介 绍 关系 模式 规范 化 的 方法 和 关系 模式 分 解 的 算法 。 


4.1 规范 化 问题 的 提出 


在 关系 数据 库 应 用 系统 设计 过 程 中 ,关系 模式 的 设计 即 数据 库 罗 辑 设计 是 数据 库 设计 
的 关键 步 又。 一 个 完备 的 关系 数据 库 模式 应 该 包括 哪些 关系 模式 ,每 一 个 关系 模式 应 该 包 
括 哪些 属性 ,这 些 相 互 关联 的 关系 模式 又 如 何 组 合 形成 关系 模型 ,这些 都 将 决定 应 用 系统 运 
行 的 状态 ,进一步 决定 数据 库 系 统 设计 的 成 败 。 利 用 关系 数据 库 理 论 指 导数 据 库 的 逻辑 设 
计 , 将 关系 模式 规范 化 ,使 每 个 关系 模式 中 属性 之 间 的 数据 依赖 关系 达到 合理 的 程度 ,由 此 
构建 的 关系 数据 库 才 能 保证 数据 库 应 用 系统 的 可 靠 运 行 ,否则 ,没有 理论 指导 所 设计 的 关系 
数据 库 会 产生 一 系列 的 操作 异常 问题 。 

下 面 通过 实例 分 析 未 经 规范 化 的 关系 模式 将 产生 的 诸多 异常 问题 及 关系 模式 规范 化 设 
计 的 必要 性 。 

【 例 1】 设计 一 个 高 校 教 学 管理 数据 库 。 与 学 生 相 关 的 数据 项 包括 : 学 生 的 学 号 
(Sno) ,姓名 (Sname) ,性 别 (Ssex) ,所 在 系 (Sdept) 、 系 主任 姓名 (Mname) .课程 号 (Cno) , 课 
程 名 (Cname) 及 成 绩 (Grade)。 

解 : 分 析 构 建 的 单一 的 关系 模式 为 : 


SCD(Sno, Sname, Ssex, Sdept, Mname, Cno, Cname, Grade) 
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分 析 现 实 世 界 的 客观 事实 ,相关 语义 如 下 : 

@ 一 个 系 有 若干 学 生 , 但 一 个 学 生 只 属于 一 个 系 ; 

@@ 一 个 系 只 有 一 名 主任 ; 

回 一 个 学 生 可 以 选修 多 门 课程 ,每 门 课程 有 若干 学 生 选 修 ; 

@ 每 个 学 生 学 习 每 一 门 课程 有 一 个 成 绩 。 

结合 上 述 语义 ,SCD 关系 模式 的 一 部 分 数据 组 成 的 实例 如 表 4-1 所 示 。 
表 4-1 关系 模式 SCD 实例 数据 表 


Sno Sname Ssex Sdept Mname Cno Cname Grade 
1701010302 张杰 女 机 械 学 院 王 伟 01002 工程 制图 81 
1701010302 张杰 女 机 械 学 院 王 伟 01003 理论 力学 75 
1701020219 赵 冬 男 机 械 学 院 王 伟 01002 工程 制图 62 
1701020219 赵 冬 男 机 械 学 院 王 伟 01004 机 械 设计 76 
1703010208 李 丽 女 信息 学 院 张 凯 03001 C 程序 设计 93 
1703010208 李 丽 女 信息 学 院 张 凯 03002 数据 结构 87 
1703050213 周平 男 信息 学 院 张 凯 03001 C 程 序 设计 90 
1703050213 周平 男 信息 学 院 张 凯 03003 信息 论 基 础 88 


结合 上 述 的 语义 来 分 析 表 4-1 中 的 数据 ,关系 模式 SCD 操作 时 会 出 现 以 下 儿 方 面 的 
问题 ， 

(1) 数据 宛 余 量 大 

每 个 系 名 和 系 主任 的 名 字 存 储 的 次 数 等 于 该 系 的 学 生 人 数 乘 以 每 个 学 生 选 修 的 课程 门 
数 ,同时 学 生 的 姓名 、 课 程 名 也 都 重复 存储 多 次 ,数据 的 宛 余 度 很 大 ,浪费 了 存储 空间 。 

(2) 插入 异常 

如 果 某 个 新 系 没有 招生 , 尚 无 学 生 时 , 则 系 名 和 系 主任 的 信息 无 法 插入 到 数据 库 中 。 因 
为 在 这 个 关系 模式 中 , 主 码 是 (Sno,Cno) ,根据 关系 的 实体 完整 性 约束 , 主 码 的 值 不 能 为 空 ， 
没有 学 生 ,Sno 和 Cno 均 无 值 ,因此 不 能 进行 插入 操作 。 

(3) 删除 异常 

当 某 系 学 生 全 部 毕业 而 没有 招生 时 ,要 删除 全 部 学 生 的 记录 ,这 时 系 名 、 系 主任 也 随 之 
删除 ,这 个 系 依然 存在 ,但 在 数据 库 中 却 无 法 找到 该 系 的 信息 。 

(4) 更 新 异常 

如 果 某 系 换 主任 , 则 该 系 学 生 的 所 有 记录 都 要 逐一 修改 Mname 的 值 , 如 不 慎 漏 改 某 些 
记录 ,就 会 造成 不 一 致 现象 ,破坏 数据 的 完整 性 。 

综 上 所 述 ,可 以 看 出 关系 模式 SCD 不 是 合理 的 模式 。 一 个 合理 的 模式 不 应 当 发 生 插 入 
异常 .删除 异常 和 更 新 异常 ,数据 元 余 应 尽 可 能 少 。 

对 于 有 问题 的 关系 模式 ,可 以 通过 模式 分 解 的 方法 使 之 规范 化 ,关系 模式 SCD 可 以 分 
解 为 四 个 结构 简单 的 关系 模式 : 

学 生 关 系 Student(Sno, Sname, Ssex, Sdept) 

课程 关系 Course(Cno, Cname) 


选课 关系 SC(Sno, Cno, Grade) 
系 别 关系 Dept(Sdept, Mname) 


分 解 后 的 四 个 关系 模式 的 实例 数据 分 别 如 表 4-2 一 表 4-5 所 示 。 
表 4-2 关系 模式 Student 实例 数据 表 


Sno Sname Ssex Sdept 
1701010302 张杰 女 机 械 学 院 
1701020219 赵 冬 男 机 械 学 院 
1703010208 李 丽 女 信息 学 院 
1703050213 周平 男 信息 学 院 

表 4-3 关系 模式 Course 实例 数据 表 
Cno Cname Cno Cname 
01002 工程 制图 03001 C 程序 设计 
01003 理论 力学 03002 数据 结构 
01004 机 械 设 计 03003 信息 论 基础 
表 4-4 关系 模式 SC 实例 数据 表 
Sno Cno Grade 

1701010302 01002 81 

1701010302 01003 75 

1701020219 01002 62 

1701020219 01004 76 

1703010208 03001 93 

1703010208 03002 87 

1703050213 03001 90 

1703050213 03003 88 

表 4-5 关系 模式 Dept 实例 数据 表 
Sdept Mname Sdept Mname 
机 械 学 院 王 伟 信息 学 院 张 凯 


对 比 表 4-1 和 分 解 后 的 表 4-2 一 表 4-5 的 实例 数据 可 以 看 出 ,对 于 分 解 后 的 四 个 关系 模 
式 ,数据 的 完 余 度 明 显 降低 。 当 需要 插入 一 个 系 时 ,在 关系 Dept 中 添加 一 条 记录 即 可 ,避免 
了 插入 异常 。 当 一 个 系 的 学 生 都 毕业 时 ,只 需 在 Student 中 删除 该 系 的 全 部 毕业 生 记 录 , 关 
系 Dept 中 该 系 的 信息 仍然 存在 ,不 会 引起 删除 异常 。 同 时 ,由 于 数据 宛 余 度 的 降低 ,数据 没 
有 重复 存储 ,也 不 会 引起 更 新 异常 。 

经 过 上 述 实 例 分 析 , 可 以 得 出 结论 ,对 于 实际 操作 存在 异常 问题 的 关系 模式 ,通过 模式 
分 解 可 以 转换 成 若干 个 关系 模式 的 集合 ,分 解 后 的 多 个 关系 模式 构成 一 个 较 好 的 、 合 理 的 关 
系数 据 库 模式 ,能够 避免 许多 异常 问题 的 出 现 。 


4.2 关系 模式 的 规范 化 


关系 模式 的 规范 化 理论 最 早 是 由 关系 数据 库 的 创始 人 E. F. Codd 提出 的 ,后 经 许多 专 


家 学 者 进行 了 多 年 深入 的 研究 ,形成 了 一 整套 有 关 关系 数据 库 设计 的 理论 ,成 为 关系 数据 库 | 章 
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设计 的 理论 指南 。 

从 1971 年 开始 ,E.F. Codd 相继 提出 了 第 一 范式 、 第 二 范式 及 第 三 范式 ,1974 年 ,Codd 
与 Boyce 合作 提出 了 Boyce-Codd 范式 ,1976 年 Fagin 等 人 又 提出 了 第 四 范式 ,后 来 又 有 学 
者 提出 了 第 五 范式 。 一 个 低 一 级 范式 的 关系 模式 ,通过 模式 分 解 转化 为 若干 个 高 一 级 范式 
的 关系 模式 的 集合 ,这 种 分 解 过 程 称 为 关系 模式 的 规范 化 (Normalization ) 。 

进一步 分 析 例 1 中 关系 模式 SCD 出 现 的 诸多 操作 异常 问题 ,是 由 于 关系 模式 内 部 的 属 
性 之 间 相互 依赖 及 相互 制约 ,存在 复杂 的 数据 依赖 关系 ,只 有 根据 实际 情况 分 析 这 些 属性 之 
间 的 数据 依赖 关系 ,通过 模式 分 解 把 一 个 关系 模式 分 解 成 两 个 或 多 个 关系 模式 ,在 分 解 的 过 
程 中 逐步 消除 可 能 引起 操作 异常 的 数据 依赖 ,才能 获得 数据 操作 性 良好 的 关系 模式 。 

本 节 介 绍 关系 模式 中 各 属性 之 间 抑 数 依赖 及 多 值 依赖 的 相关 概念 ,关系 模式 的 不 同 范 
式 等 级 的 要 求 ,以 及 关系 模式 规范 化 的 步骤 。 


4.2.1 函数 依 顿 及 码 的 概念 


1. 关系 模式 的 简化 表示 法 
关系 模式 的 完整 表示 是 一 个 五 元 组 : 
R(U, D, Dom, F) 

其 中 ,R 为 关系 名 ; U 为 关系 的 属性 集合 ; D 为 属性 集 U 中 属性 的 数据 域 , Dom 为 属性 到 
域 的 映射 ; 下 为 属性 集 U 的 数据 依赖 集 。 

由 于 D 和 Dom 对 设计 关系 模式 的 作用 不 大 ,在 讨论 关系 规范 化 理论 时 可 以 把 它们 简 
化 掉 , 因 此 ,关系 模式 可 以 用 三 元 组 来 表示 : 

R(U, F) 

从 上 式 可 以 看 出 ,数据 依赖 是 关系 模式 的 要 素 。 数 据 依赖 (Data Dependency) 是 同一 关 
系 中 属性 间 的 相互 依赖 和 相互 制约 。 数 据 依赖 包括 函数 依赖 (Functional Dependency， 
FD) ,多 值 依赖 (Multivalued Dependency, MVD) 和 连接 依赖 (Join Dependency) ,数据 依赖 
是 关系 规范 化 的 理论 基础 。 

2. 函数 依赖 的 概念 

函数 依赖 讨论 的 是 同一 关系 模式 中 属性 之 间 的 依赖 关系 ,属性 之 间 是 否 存在 函数 依赖 
只 与 语义 有 关 。 下 面 给 出 函数 依赖 的 形式 化 定义 。 

定义 4.1 设 R(U) 是 一 个 属性 集 U 上 的 关系 模式 ,.X 和 是 TU 的 子 集 。 若 对 于 
R(CU) 的 任意 一 个 可 能 的 关系 r,r 中 不 可 能 存在 两 个 元 组 在 X 上 的 属性 值 相等 ,而 在 Y 上 
的 属性 值 不 等 , 则 称 X 函数 确定 站 或 Y 函数 依赖 于 X, 记 作 X-~Y。 

函数 依赖 是 属性 或 属性 之 间 一 一 对 应 的 关系 , 它 要 求 按 此 关系 模式 建立 的 任何 关系 都 
应 满足 下 中 的 约 东 条 件 。 以 下 是 相关 术语 及 表示 符号 。 

Q@ 如 果 X=>Y, 但 YSX, 则 称 X>Y 是 平凡 的 函数 依赖 。 

@ 如 果 X=>Y., 但 Y 壬 X, 则 称 X 一 Y 是 非 平凡 的 函数 依赖 。 对 于 任 一 关系 模式 ,平凡 函 
数 依赖 都 是 必然 成 立 的 。 如 不 作 特 别 说 明 ,讨论 的 都 是 非 平 凡 的 函数 依赖 。 

@ 如 果 X 一 了 , 则 称 X 为 这 个 函数 依赖 的 决定 因素 ,Y 为 依赖 因素 。 

@ 如 果 XY, 并 且 YX, 则 记 作 XY。 

@ 如 果 Y 函数 不 依赖 于 义 , 则 记 作 Xz> Y。 


【 例 2】 试 确定 关系 模式 SCD(Sno,Sname,Ssex,Sdept,Mname,Cno,Cname,Grade) 
中 的 简单 的 函数 依赖 关系 。 
解 : 根据 关系 SCD 中 各 属性 的 语义 分 析 , 属 性 间 的 函数 依赖 关系 为 : 
U= {Sno,Sname,Ssex, Sdept, Mname,Cno,Cname,Grade} 
F= {Sno>Sname, Sno—>Ssex, Sno>Sdept, Sdept>Mname,(Sno, Cno) 一 Grade} 
定义 4.2 在 RCU) 中 ,如 果 X-~Y, 并 且 对 于 X 的 任何 一 个 真子 集 X ,都 有 X' 全 Y, 则 
称 YY 对 义 完全 函数 依赖 , 记 作 XX 一 ~Y; 若 X-~Y, 但 立 函 数 不 完 全 依赖 于 X, 则 称 立 对 X 
部 分 函数 依赖 , 记 作 XX 一 > Y。 
【 例 3】 试 分 析 确 定 关 系 模式 SCD(Sno,,Sname,Ssex, Sdept, Mname, Cno, Cname，, 
Grade) 属 性 间 存 在 的 完全 函数 依赖 及 部 分 函数 依赖 关系 。 
解 : 在 关系 模式 SCD 中 主 码 为 (Sno,，Cno), 其 中 完全 函数 依赖 及 部 分 函数 依赖 关 
系 为 : 


因为 Show Geilde; HL Cho ~ Grade, DUSno, Caoj- Gates 
因为 Sho 一 Sname, 所 以 (Sno, Cno) 一 > Sname; 

因为 Sno 一 Ssex, 所 以 (Sno, Cno) 一 > Ssex; 

因为 Sho 一 Sdept, 所 以 (Sno, Cno) 一 > Sdept; 


因为 Cno~Cname, 所 以 (Sno, Cno) 一 > Cname 
定义 4.3 在 R(U) 中 ,如 果 X>Y(Y 壬 X),Y > X,Y 一 Z,Z 和 EY, 则 称 Z 对 X 传 递 隙 数 


依赖 (transitive functional dependency) 。 记 为 : A 如 果 Y 一 X, 即 X< 一 一 Y, 则 2Z 直 
接 依赖 于 XX, 而 不 是 传递 函数 依赖 。 

【 例 4】 试 分 析 确 定 关 系 模式 SCD(Sno,,Sname,Ssex, Sdept, Mname, Cno, Cname，, 
Grade) 中 的 传递 函数 依赖 关系 。 

解 : 由 于 Sno 一 Sdept,Sdept 一 Mname, 因 此 


Mname 传递 函数 依赖 于 Sno, 即 sie Mname 

3. 码 的 概念 

本 书 第 2 章 已 介绍 有 关 码 的 定义 ,本 节 用 函数 依赖 的 概念 来 定义 码 。 

定义 4.4 设 K 为 RCU,F) 中 的 属性 或 属性 组 合 。 若 上 一 > U, 则 区 称 为 尺 的 一 个 候选 
码 (Candidate Key); 若 关系 模式 R 有 多 个 候选 码 , 则 选 定 其 中 的 一 个 作为 主 码 (Primary key) 。 

称 包含 在 候选 码 中 的 属性 为 主 属性 (Prime attribute) ,不 包含 在 任何 候选 码 中 的 属性 
称 为 非 主 属性 (Nonprime attribute) 或 非 码 属性 (Non-key attribute) 。 最 简单 的 码 是 单个 属 
性 ,最 复杂 的 情况 ,整个 属性 组 是 码 , 称 为 全 码 (All-key)。 以 后 的 论述 中 主 码 和 候选 码 常 简 
称 为 码 。 

【 例 5】 确定 学 生 关 系 Student (Sno, Sname, Ssex, Sdept) ,课程 关系 Course(Cno， 
Cname) 及 选课 关系 SC(Sno,Cno,Grade) 的 码 。 
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解 : 学 生 关系 Student(Sno,Sname,Ssex,Sdept) 的 码 是 单个 属性 Sno; 

课程 关系 Course(Cno,Cname) 的 码 是 单个 属性 Cno; 

选课 关系 SCCSno,Cno,Grade) 的 码 是 属性 组 合 (Sno,Cno) 。 

定义 4.5 关系 模式 R(U) 中 属性 或 属性 组 X 并 非 R 的 码 , 但 X 是 另 一 个 关系 模式 的 
码 , 则 称 X 是 RR 的 外 部 码 (Foreign key) ,也 称 外 码 。 主 码 与 外 码 一 起 提供 了 表示 关系 间 联 
系 的 手段 。 

【 例 6】 确定 在 选课 关系 SC(Sno,Cno,Grade) 中 的 外 码 。 

解 : 在 选课 关系 SC(Sno,Cno, Grade) 中 属性 Cno 不 是 码 , Cno 是 课程 关系 Course 
(Cno,Cname) 的 码 , 则 Cno 是 关系 模式 SC 的 外 码 。 关 系 SC 与 关系 Course 之 间 通 过 Cno 
进行 联系 。 


4.2.2 关系 模式 的 范式 


所 谓 范式 (Normal Form) 是 指 规范 化 的 关系 模式 ,范式 是 关系 模式 规范 化 程度 的 衡量 
标准 。 由 于 规范 化 的 程度 不 同 ,就 产生 了 不 同 的 范式 。 满 足 最 基本 要 求 的 关系 模式 为 第 一 
范式 ,简称 INF; 在 第 一 范式 基础 上 再 满足 另外 一 些 约束 条 件 的 关系 称 为 第 二 范式 , 即 
2NF, 依 此 产生 第 三 范式 (3NF) 、Boyce-Codd 范式 (简称 BC 范式 ,BCNF)、 第 四 范式 (4NF) 
和 第 五 范式 (5NF) , 某 一 关系 模式 R 为 第 范式 , 则 简写 为 REnNF。 每 种 范式 都 应 满足 与 
之 相应 的 约束 条 件 。 关 系 模式 的 规范 化 程度 越 高 , 则 范式 级 别 越 高 。 

各 种 范式 之 间 的 关系 如 图 4-1 所 示 , 可 表示 为 : 5NFC4NFCBCNFC3NFC2NF( 
1NF ,下 面 分 别 介绍 各 种 范式 的 定义 ,并 详细 曾 述 关系 模式 逐步 分 解 、 范 式 级 别 逐 步 提 高 的 
相关 实例 。 


BCNF 
4NF 


图 4-1 各 种 范式 之 间 的 关系 
1. 第 一 范式 
第 一 范式 是 关系 最 基本 的 规范 形式 , 即 关系 中 每 个 属性 都 是 不 可 再 分 的 简单 数据 项 。 
定义 4.6 如果 关系 模式 R 所 有 的 属性 均 为 简单 属性 , 即 每 个 属性 都 是 不 可 再 分 的 , 则 
称 R 属于 第 一 范式 (First Normal Form) , 记 作 RE1NF。 
满足 1NF 的 关系 称 为 规范 化 关系 ,不 满足 INF 的 关系 称 为 非 规范 化 关系 。 在 关系 数 


据 库 系统 中 只 讨论 规范 化 的 关系 ,凡是 非 规范 化 的 关系 模式 必须 转化 成 规范 化 的 关系 ,INF 
是 关系 模式 应 满足 的 最 起 码 的 要 求 。 

关系 模式 仅仅 满足 第 一 范式 是 不 够 的 ,如 例 1 中 的 关系 SCDE INF ,但 会 在 实际 操作 中 
出 现 插入 异常 .删除 异常 .更 新 异常 及 数据 元 余 大 等 问题 。 通 过 例 2、 例 3 及 例 4 的 分 析 , 关 
系 模式 SCD (Sno, Sname, Ssex，Sdept, Mname， a 
Cno,Cname,Grade) 中 属性 间 存 在 多 种 函数 依赖 < a 
关系 ,如 图 4-2 所 示 。 图 中 虚线 表示 部 分 函数 依 E 
赖 , 实 线 表示 完全 函数 依赖 。 复杂 的 函数 依赖 关 
系 导致 了 诸多 操作 异常 ,只 有 对 关系 模式 进行 分 “ww 
解 规范 ,在 规范 过 程 中 逐步 消除 这 些 复杂 的 函数 So | 
依赖 关系 ,使 关系 模式 满足 更 高 的 范式 要 求 ,才能 图 42 关系 模式 SCD 中 的 函数 依赖 示意 图 
成 为 实用 的 关系 模式 。 

2. 第 二 范式 

定义 4.7 如果 关系 模式 RE1NF, 且 每 个 非 主 属性 都 完全 函数 依赖 于 R 的 码 , 则 称 R 
属于 第 二 范式 (Second Normal Form), 记 作 RE2NF。 如 果 数 据 库 模 式 中 每 个 关系 模式 都 
是 2NF, 则 这 个 数据 库 模式 称 为 2NF 的 数据 库 模 式 。 

如 果 一 个 关系 模式 R 仅 满 足 1NF 而 不 满足 2NF, 则 会 出 现 多 种 操作 异常 问题 。 如 例 1 
中 的 关系 模式 SCD 的 码 为 (Sno,Cno) 的 组 合 ,Sname、Ssex、Sdept、Mname、Cname 及 Grade 
均 为 非 主 属性 ,经 例 3 分 析 , 其 中 存在 多 个 非 主 属性 对 码 的 部 分 函数 依赖 ,所 以 关系 模式 
SCDS2NF。 例 1 中 已 分 析 过 ,关系 SCD 在 实际 操作 中 将 会 出 现 插入 异常 .删除 异常 更 新 
异常 及 数据 宛 余 大 等 问题 。 避 免 出 现 异常 问题 的 办 法 是 对 关系 模式 进行 规范 化 ,在 规范 过 
程 中 逐步 消除 复杂 的 函数 依赖 关系 ,使 关系 模式 逐步 满足 更 高 的 范式 要 求 。 

根据 上 述 定 义 分析 , 可 得 到 以 下 结论 : 

(1) 从 1NF 关系 中 消除 非 主 属性 对 码 的 部 分 函数 依赖 , 则 可 使 RE2NF; 

(2) 如 果 R 的 码 为 单 属性 ,或 R 的 全 体 属性 均 为 主 属性 , 则 RE2NF。 

将 满足 1NF 的 关系 模式 通过 投影 分 解 , 转 换 成 2NF 关系 模式 的 集合 的 过 程 称 为 2NF 
规范 化 。 分 解 的 基本 原则 是 让 一 个 关系 只 描述 一 个 实体 或 者 实体 间 的 联系 。 如 果 多 于 一 个 
实体 或 联系 , 则 进行 投影 分 解 。 用 模式 分 解 的 方法 将 非 第 二 范式 关系 分 解 为 多 个 第 二 范式 
关系 的 集合 ,消除 部 分 函数 依赖 的 分 解 过 程 为 : 

(1) 用 组 成 码 的 属性 集合 的 每 一 个 子 集 作为 码 构成 一 个 关系 模式 ; 

(2) 将 依赖 于 这 些 码 的 属性 放置 到 相应 的 关系 模式 中 ; 

(3) 最 后 去 掉 仅 由 码 的 子 集 构成 的 关系 模式 。 

【 例 7】 将 教学 管理 系统 的 关系 模式 SCD(Sno. Sname, Ssex, Sdept, Mname, Cno， 
Cname,Grade) 规 范 为 2NF。 

解 : 经 过 例 2、 例 3 及 例 4 的 分 析 , 已 得 到 关系 模式 SCD 中 的 各 种 函数 依赖 关系 ,如 
图 4-2 所 示 , 码 为 (Sno,Cno), 其 中 存在 多 个 非 主 属性 对 码 的 部 分 函数 依赖 。 

为 了 消除 部 分 函数 依赖 ,依据 上 述 分 解 过 程 对 关系 模式 SCD(Sno,Sname,Ssex,Sdept， 
Mname,Cno,Cname,Grade) 进 行 分 解 , 码 的 子 集 有 三 个 : Sno、Cno 及 (Sno,Cno) ,分 解 过 
程 为 : 


Grade | 严 -站 所 Sdept 


Cname 
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(1) 将 该 关系 模式 SCD 分 解 为 如 下 三 个 关系 模式 (下 画 线 部 分 表示 码 ) : 
SD(Sno,…) 

Course(Cno,，…) 

SCCSno,Cno，…) 

(2) 将 依赖 于 这 些 码 的 属性 放 入 相应 的 关系 模式 中 ,形成 三 个 关系 模式 ; 
SD(Sno,Sname, Ssex, Sdept, Mname) 

Course(Cno,Cname) 

SC(Sno, Cno, Grade) 

(3) 去 掉 仅 由 码 的 子 集 构成 的 关系 模式 ,本 例 中 没有 ,不 需 去 掉 。 

分 解 后 的 三 个 关系 模式 SD、Course 及 SC 中 的 函数 依赖 关系 如 图 4-3 所 示 。 


Cno 上 一 一 Cname | 

Sname 
(b) 关系 模式 Course 
Ssex 
Sno [Sdept | Sno 
= | 
Mname Cno [Lorae ] 
(a) 关系 模式 SD (©) 关系 模式 SC 


图 4-3 关系 模式 中 的 函数 依赖 示意 图 


下 面 分 析 验 证 这 三 个 关系 是 否 满足 2NF: 
(1) 关系 SD(Sno,Sname,Ssex,Sdept, Mname) 的 码 是 Sno, 存 在 函数 依赖 关系 : 


Sno ! >Sname, Sno >Ssex, Sno 。 Sdepty Sno Mname 
因此 满足 第 二 范式 要 求 ,SDE2NF。 
(2) 关系 Course(Cno,Cname) 的 码 是 Cno, 存 在 函数 依赖 关系 : 
Cno ie 
因此 满足 第 二 范式 要 求 ,Course€ 2NF。 
(3) 关系 SC(Sno，Cno, Grade) 的 码 是 (Sno,Cno) ,存在 函数 依赖 关系 : 
(Sh6y Cao Cia 
因此 也 满足 第 二 范式 要 求 ,SCE 2NF。 
综 上 所 述 ,教学 管理 系统 中 的 每 个 关系 模式 都 是 2NF, 因 此 这 个 数据 库 模式 是 2NF 的 
数据 库 模式 。 现 在 分 析 一 下 满足 2NF 的 数据 库 模 式 是 否 存在 操作 异常 。 
关系 模式 SD(Sno,Sname,Ssex,Sdept, Mname) 的 部 分 数据 如 表 4-6 所 示 。 
表 4-6 关系 模式 SD 实例 数据 表 


Sno Sname Ssex Sdept Mname 
1701010302 张杰 女 机 械 学 院 王 伟 
1701020219 赵 冬 男 机 械 学 院 王 伟 
1703010208 李 丽 女 信息 学 院 张 凯 
1703050213 周平 男 信息 学 院 张 凯 


分 析 表 4-6 所 示 的 数据 可 以 看 到 ,2NF 的 关系 模式 解决 了 1NF 中 存在 的 一 些 问题 ,但 
2NF 的 关系 模式 在 进行 数据 操作 时 ,仍然 存在 下 列 操作 异常 等 问题 ,还 需要 对 其 进一步 分 
解 , 以 满足 更 高 级 别 范式 的 要 求 。 

(1) 数据 宛 余 

表 中 重复 描述 每 个 系 名 及 系 主任 名 ,重复 的 次 数 与 每 个 系 学 生 人 数 相 同 。 

(2) 插入 异常 

当 新 组 建 一 个 系 时 , 系 主任 车 已 上 任 , 如 果 该 系 还 没有 招生 , 则 无 法 将 该 系 的 系 名 及 系 
主任 名 插入 到 表 中 ,因为 主 码 学 号 Sno 为 空 。 

(3) 删除 异常 

若 某 系 学 生 全 部 毕业 而 没有 招生 时 ,删除 全 部 学 生 的 记录 同时 也 删除 了 该 系 名 称 等 有 
关 信 息 。 

(4) 更 新 异常 

当 更 换 系 主任 时 , 仍 需 改 动 属于 该 系 所 有 的 学 生 记 录 。 

3. 第 三 范式 

定义 4.8 ”如 果 关 系 模式 R(U,F)E2NF, 且 每 个 非 主 属性 都 不 传递 函数 依赖 于 RR 的 
码 , 则 称 R(U,F) 属 于 第 三 范式 (Third Normal Form) , 记 作 RE3NF。 

由 定义 4.8 可 以 推出 ,如 果 关 系 模式 R 存在 非 主 属性 对 码 的 传递 依赖 , 则 R 不 属于 第 
三 范式 。 

分 析 例 4-7 中 的 关系 模式 SD(Sno,，Sname，Ssex，Sdept, Mname) ,存在 函数 依赖 : 

Sno—>Sdept, Sdept™ Mname 


so Mname 

关系 模式 SD 中 存在 传递 函数 依赖 ,不 属于 第 三 范式 。 经 例 7 分 析 可 知 ,关系 SD 仍然 
存在 操作 异常 等 问题 ,因此 ,需要 对 其 进一步 分 解 ,使 其 成 为 第 三 范式 关系 。 

为 了 消除 传递 函数 依赖 ,将 关系 模式 规范 为 第 三 范式 的 分 解 过 程 为 : 

(1) 对 于 不 是 码 的 每 个 决定 因素 ,从 关系 模式 中 删 去 依赖 于 它 的 所 有 属性 。 

(2) 新 建 一 个 关系 模式 ,新 的 关系 模式 中 包含 原 关 系 模式 中 所 有 依赖 于 该 决定 因素 的 
属性 。 

(3) 将 决定 因素 作为 新 关系 模式 的 码 。 

【 例 8〗 将 关系 模式 SD(Sno, Sname, Ssex, Sdept, Mname) 规 范 为 3NF。 

解 : 分 析 关 系 模式 中 各 属性 的 关系 ,存在 两 个 决定 因素 Sno 及 Sdept, SD 的 码 是 Sno， 
Sdept 是 非 码 的 决定 因素 。 为 了 消除 传递 函数 依赖 ,应 从 关系 模式 SD 中 删 去 依赖 于 Sdept 
的 属性 Mname, 新 建 一 个 关系 模式 Dept, 包 含 属性 Sdept 及 Mname, 并 将 属性 Sdept 作为 
新 关系 模式 Dept 的 码 。 这 样 ,关系 模式 SD 分 解 后 变 成 的 两 个 关系 模式 Student 及 Dept 
如 下 : 

Student(Sno, Sname, Ssex, Sdept) , 码 为 Sno。 

Dept(Sdept，Mname) , 码 为 Sdept。 

分 解 后 关系 模式 Student 及 Dept 中 属性 间 的 函数 依赖 关系 如 图 4-4 所 示 。 

到 目前 为 止 ,关系 模式 SCD(Sno.,Sname,Ssex. Sdept, Mname,Cno, Cname,Grade) 分 
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解 后 形成 四 个 关系 模式 Course、SC、Student 及 Dept, 各 关系 模式 中 的 函数 依赖 关系 分 别 如 


图 4-3 及 图 4-4 所 示 。 
[ Sname | 
< Ssex Sdept [——™=| Mname 
Sdept 


(a) 关系 模式 Student (b) 关系 模式 Dept 
图 4-4 关系 模式 中 的 函数 依赖 示意 图 
下 面 分 析 验 证 四 个 关系 是 否 满足 3NF。 


f 
@ 关系 模式 Student (Sno，Sname，Ssex，Sdept) 中 的 函数 依赖 Sno 一 > Sname， 
f 
Sno 一 >Ssex,Sno 一 >Sdept, 因 此 关系 Student€ 3NF。 


@ 关系 模式 Dept (Sdept，Mname) 中 的 函数 依赖 ;Sdept = ia 因此 关系 
DeptE3NF。 


@ 关系 模式 Course(Cno,Cname) 中 的 函数 依赖 : Cno = Cname, 因 此 关系 Course€ 
3NF。 


@ 关系 模式 SC(Sno,Cno,Grade) 码 是 (Sno,Cno) ,存在 函数 依赖 : (Sno， JE 
Grade, 因 此 关系 SCE3NF。 

经 过 上 述 分 析 , 四 个 关系 模式 Student、Dept、Course 及 SC 都 满足 3NF 的 要 求 。 

本 节 对 关系 模式 SCD(Sno,Sname,Ssex, Sdept, Sloc, Cno,Cname,Grade) 进 行 了 一 系 
列 的 函数 依赖 关系 分 析 及 关系 模式 的 逐步 分 解 ,将 SCD 分 解 为 四 个 关系 模式 ,每 个 关系 模 
式 都 满足 3NF 的 要 求 。 由 于 3NF 关系 模式 中 不 存在 非 主 属性 对 码 的 部 分 函数 依赖 和 传递 
函数 依赖 ,在 很 大 程度 上 消除 了 数据 元 余 和 操作 异常 。 因 此 3NF 是 一 个 可 用 的 关系 模式 应 
满足 的 最 低 范式 , 即 一 个 关系 模式 如 果 不 满足 3NF, 实 际 上 是 不 能 使 用 的 。 在 实际 数据 库 
应 用 系统 设计 中 ,一 般 数 据 库 模 式 达 到 3NF 即 可 。 

4. BC 范式 

前 面 讨论 的 第 二 范式 和 第 三 范式 不 允许 存在 非 主 属性 对 码 的 部 分 函数 依赖 和 传递 函数 
依赖 ,但 这 些 定义 并 没有 考虑 主 属性 对 候选 码 的 依赖 问题 。BCNF (Boyce Codd Normal 
Form) 是 由 Boyce 和 Codd 共同 提出 的 , 它 是 在 考虑 了 关系 中 属性 对 所 有 候选 码 的 函数 依赖 
的 基础 上 定义 的 ,人 们 通常 认为 BCNF 是 修正 的 3NF。 

定义 4.9 设 关系 模式 RCIU,F)E1INF, 若 X=Y 且 YGSX 时 X 必 含有 码 , 则 RCIU,F)E 
BCNF 。 

即 在 关系 模式 RCIU,F) 中 ,如 果 每 一 个 决定 属性 集 都 包含 候选 码 , 则 RE BCNF。 

由 BCNEF 的 定义 可 以 得 到 结论 ,一 个 满足 BCNF 的 关系 模式 有 以 下 性 质 : 

(1) 所 有 非 主 属性 对 每 一 个 码 都 是 完全 函数 依赖 。 

(2) 没有 任何 属性 完全 函数 依赖 于 非 码 的 任何 一 组 属性 。 

对 比分 析 定 义 4. 8 与 定义 4.9,BCNF 和 3NF 的 区 别 主 要 体现 在 以 下 两 点 : 

(1) BCNF 不 仅 强调 非 主 属性 对 码 的 完全 的 、 直 接 的 函数 依赖 ,而 且 强 调 主 属性 对 码 的 


完全 的 直接 的 函数 依赖 , 它 包 括 3NF, 即 REBCNF, 则 R 一定 属于 3NF; 

(2) 3NF 只 强调 非 主 属性 对 码 的 完全 的 、 直 接 的 函数 依赖 ,这 样 就 可 能 出 现 主 属性 对 码 
的 部 分 函数 依赖 和 传递 函数 依赖 。 

如 果 RE BCNF, 由 于 R 消除 了 任何 属性 对 码 的 传递 依赖 与 部 分 依赖 ,所 以 一 定 有 RE 
3NF。 但 是 ,车 RE3NF, 则 R 未 必 属 于 BCNF。 

【 例 9】 分 析 确 定 关系 模式 Student(Sno,Sname,Sdept,Ssex) 是 否 属于 BCNF 。 

解 : 假定 属性 Sname 具有 唯一 性 , 即 学 生 没有 重 名 的 ,那么 关系 Student 有 两 个 码 Sno 
及 Sname, 这 两 个 码 都 由 单个 属性 组 成 ,属性 间 不 互相 包含 。 

(1) 非 主 属性 不 存在 对 码 的 传递 依赖 与 部 分 依赖 ,所 以 关系 Student€ 3NF。 

(2) 同时 关系 Student 中 两 个 决定 因素 Sno、 Sname 都 是 码 ,所 以 关系 Student E 
BCNF, 

【 例 10】 分 析 确定 关系 模式 SNC (Sno, Sname, Cno, Grade) 是 否 属于 BCNF ,如 果 不 
属于 BCNF 则 规范 到 BCNF 。 

解 : 假定 属性 Sname 具有 唯一 性 , 则 关系 模式 SNC 中 有 两 个 候选 码 (Sno，Cno) 和 
(Sname，Cno) ,存在 如 下 函数 依赖 : 

Sno< 一 Sname,(Sno，Cno) 一 Grade,(Sname，Cno) 一 Grade 

非 主 属性 Grade 不 存在 对 码 的 传递 函数 依赖 与 部 分 函数 依赖 ,所 以 关系 SNCE 3NF。 
但 是 ,由 于 Sno< 和 一 一 Sname, 说 明 Sno 及 Sname 都 是 决定 因素 , 却 都 不 包含 候选 码 ,因此 关系 
SNC 不 属于 BCNF 。 

不 属于 BCNF 的 关系 模式 实际 操作 时 仍然 存在 不 合适 的 地 方 , 非 BCNF 的 关系 模式 可 
以 通过 分 解 的 方法 将 其 转换 成 BCNF。BCNF 规范 化 是 指 把 3NF 的 关系 模式 通过 投影 分 
解 转换 成 BCNF 关系 模式 的 集合 。 

将 关系 模式 SNC(Sno， Sname， Cno, Grade) 分 解 为 关系 模式 SNCSno, Sname) 和 关系 
模式 SCCSno，Cno，Grade) 。 下 面 讨 论 分 解 后 的 关系 模式 是 否 属于 BCNF: 

OO 关系 模式 SN 的 候选 码 为 Sno, 其 函数 依赖 为 Sno 一 Sname, 决 定 因素 包含 了 候选 码 ， 
因此 SN 属于 BCNF , 即 SNE BCNF; 

@ 关系 模式 SC 的 候选 键 为 (Sno, Cno), 其 函数 依赖 为 (Sno,Cno) 一 Grade, 决 定 因素 
包含 了 候选 码 ,因此 SC 属于 BCNF, 即 SCE BCNF。 

如 果 一 个 关系 数据 库 中 的 所 有 关系 模式 都 属于 BCNF ,那么 在 函数 依赖 范畴 内 ,这 个 关 
系数 据 库 模式 已 实现 了 彻底 分 解 , 达 到 了 最 高 的 规范 化 程度 ,消除 了 插入 异常 和 删除 异常 。 

5. 多 值 依赖 及 第 四 范式 

前 面 讨论 的 是 基于 函数 依赖 概念 的 关系 模式 的 规范 化 问题 ,根据 函数 依赖 集 下 ,一 个 关 
系 模式 可 以 分 解 成 若干 个 满足 BCNF 的 子 模式 。 但 函数 依赖 表示 的 是 关系 模式 中 属性 间 
的 一 对 一 或 一 对 多 的 联系 ,并 不 能 表示 属性 间 的 多 对 多 的 联系 ,因此 即使 一 个 关系 模式 已 经 
规范 到 BCNF ,实际 操作 时 仍然 存在 一 些 异常 问题 ,为 了 改善 其 性 能 ,还 需要 研究 多 值 依赖 
以 及 基于 多 值 依赖 的 第 四 范式 问题 。 

(1) 多 值 依赖 (Multi-Valued Dependency, MVD) 

属于 BCNF 范式 的 关系 模式 是 否 就 可 以 完美 地 运行 了 ? 来 看 一 个 例子 。 
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【 例 11】 假设 学 校 中 某 一 门 课程 由 多 个 教师 讲授 ,每 门 课 使 用 相同 的 一 套 参考 书 。 每 
个 教师 可 以 讲授 多 门 课程 ,每 种 参考 书 可 以 供 多 门 课 程 使 用 , 试 分 析 该 多 对 多 的 关系 在 实际 
操作 中 是 否 出 现 异 常 。 

解 : 分 析 上 述 课程 .教师 和 参考 书 之 间 的 多 对 多 的 关系 ,可 用 非 规范 化 的 关系 来 表示 ， 
其 具体 实例 数据 如 表 4-7 所 示 。 如 果 把 这 个 非 规范 化 的 关系 转化 成 规范 化 的 关系 模式 
CTB, 其 具体 实例 数据 如 表 4-8 所 示 。 


表 4-7 非 规范 化 关系 实例 数据 表 


Cname Tname Bname 
主语 数据 库 系统 教程 
和 李 平 数据 库 原理 及 应 用 
张 红 计算 机 网 络 基础 
省 关 人 用 千 刘 宁 计算 机 网 络 技术 


表 4-8 规范 化 关系 CTB 实例 数据 表 


Cname Tname Bname 
数据 库 原理 王 浩 数据 库 系 统 教程 
数据 库 原理 王 浩 数据 库 原理 及 应 用 
数据 库 原理 李 平 数据 库 系 统 教程 
数据 库 原理 李 平 数据 库 原理 及 应 用 
计算 机 网 络 张 红 计算 机 网 络 基础 
计算 机 网 络 张 红 计算 机 网 络 技术 
计算 机 网 络 刘 宁 计算 机 网 络 基础 
计算 机 网 络 刘 宁 计算 机 网 络 技术 


规范 后 的 关系 模式 CTB 的 码 是 (Cname,Tname,Bname) , 即 全 码 , 不 存在 非 码 属性 , 因 
此 关系 CTB 属于 BCNF 范式 。 下 面 进一步 分 析 表 4-8 中 的 数据 ,可 以 发 现 关 系 CTB 存在 
许多 问题 。 

O@ 数据 元 余 

课程 .教师 和 参考 书 都 重复 出 现在 不 同 的 元 组 中 。 

@ 插入 异常 

若 为 课程 “计算 机 网 络 ? 增 加 一 名 讲授 教师 * 刘 东 ” 时 ,需要 插入 两 个 元 组 , 即 ( 计 算 机 网 
络 , 刘 东 , 计 算 机 网 络 基础 ) 和 (计算 机 网 络 , 刘 东 ,计算机 网 络 技术 ) 。 

@@ 删除 异常 

若 为 某 一 门 课 删 除 一 本 参考 书 , 则 需要 删除 与 该 参考 书 有 关 的 全 部 元 组 。 如 删除 “数据 
库 原理 ”课程 的 参考 书 “ 数 据 库 系统 教程 ”, 则 需要 删除 (数据 库 原理 , 王 浩 ,数据 库 系统 教程 ) 
和 (数据 库 原理 , 李 平 ,数据 库 系统 教程 ) 两 个 元 组 。 

综 上 所 述 ,关系 模式 CTB 中 数据 的 增删 改 都 出 现 问 题 ,同时 数据 元 余 量 大 , 究 其 原因 ， 
其 属性 间 存 在 前 面 没 有 讨论 过 的 另 一 种 数据 依赖 一 一 多 值 依赖 。 

定义 4.10 设 R(U) 是 属性 集 U 上 的 一 个 关系 模式 。X、Y、Z 是 UU 的 子 集 , 并 且 Z= 
U 一 X 一 Y。 关 系 模式 R(U) 中 多 值 依赖 X 一 一 Y 成 立 , 当 且 仅 当 对 R(U) 的 任 一 关系 r, 给 


定 的 一 对 (zx,z) 值 ,有 一 组 Y 的 值 ,这 组 值 仅仅 决定 于 zz 值 而 与 x 值 无 关 。 

例如 上 述 实例 中 的 关系 CTB(Cname，Tname，Bname) ,对 于 某 个 (Cname,，Bname) 属 
性 值 组 合 ( 计 算 机 网 络 ,计算机 网 络 基 础 ), 有 对 应 的 Tname 值 { 张 红 , 刘 宁 }; 对 于 另 一 个 
(CCname，Bname) 属 性 值 组 合 (计算 机 网 络 ,计算 机 网 络 技术 ) ,尽管 这 时 参考 书 Bname 的 值 
已 经 改变 ,对 应 的 Tname 值 仍 是 { 张 红 , 刘 宁 }。 说 明教 师 Tname 值 与 参考 书 Bname 的 值 
无 关 , 仅 仅 决 定 于 课程 Cname 的 值 ( 计 算 机 网 络 ), 因 此 教师 Tname 多 值 依 赖 于 课程 
Cname, 即 Cname 习 >Tname。 同 理 分 析 ,Cname 一 一 Bname。 

多 值 依赖 具有 以 下 性 质 : 

Q 多 值 依赖 具有 对 称 性 。 即 若 X 一 Y, 则 X-~ 一 Z, 其 中 Z 一 U 一 X 一 Y。 

@ 多 值 依赖 具有 传递 性 。 即 若 XY, X 一 一 Z, 则 X 一 一 Z 一 Y。 

@ 函数 依赖 可 以 看 作 是 多 值 依赖 的 特殊 情况 。 即 若 X-~Y, 则 XY。 这 是 因为 当 
XY 时 ,对 XX 的 每 一 个 值 x+,Y 有 一 个 确定 的 值 > 与 之 对 应 ,所 以 X-~ 一 了 。 

@ 在 多 值 依赖 中 ,车 X 一 > 了 ,而 Z=U 一 X 一 Y 二 @, 即 Z 为 空 , 则 称 X 一 >Y 为 平凡 的 
多 值 依 赖 。 否 则 称 X 一 一 Y 为 非 平 凡 的 多 值 依赖 。 

多 值 依赖 与 函数 依赖 相 比 ,具有 以 下 两 个 基本 的 区 别 : 

@ 多 值 依赖 的 有 效 性 与 属性 集 的 范围 有 关 。 

在 关系 模式 R(U) 中 ,函数 依赖 X 一 Y 的 有 效 性 仅仅 决定 X、Y 这 两 个 属性 集 ; 在 多 值 
依赖 中 ,X 一 一 Y 在 U 上 是 否 成 立 ,不 仅 与 属性 集 X、Y 上 的 值 有 关 , 而 且 与 属性 集 Z==U 一 
X 一 Y 上 的 值 有 关 。 因 此 ,如 果 X 一 Y 在 W(WCU) 上 成 立 , 而 在 U 上 则 不 一 定 成 立 。 

@ 多 值 依赖 没有 自 反 律 。 

如 果 函 数 依赖 X 一 Y 在 RCU) 上 成 立 , 则 对 于 任何 Y'CY 均 有 XY' 成 立 ; 而 多 值 依 
赖 X 一 一 Y 若 在 RCU) 上 成 立 , 对 于 任何 Y'CY 却 不 一 定 有 X 一 一 YY 成立。 

(2) 第 四 范式 

定义 4.11 关系 模式 RCIU,F)EINF, 如 果 对 于 R 的 每 个 非 平 凡 的 多 值 依赖 X 一 一 
Y(Y 壬 X),X 都 含有 码 , 则 RCIU,F)E4NF。 

4NF 就 是 限制 关系 模式 的 属性 之 间 不 允许 有 非 平凡 且 非 函数 依赖 的 多 值 依 赖 。 根 据 
定义 ,4NF 要 求 每 一 个 非 平 凡 的 多 值 依赖 X>~ 一 Y,X 都 含有 候选 码 , 则 必然 是 X~Y, 所 以 
4NF 所 允许 的 非 平凡 多 值 依赖 实际 上 是 函数 依赖 。 那 么 一 个 属于 BCNF 的 关系 模式 ,是 否 
一 定 属于 4NF 呢 ? 

【 例 12】 分 析 确 定 关系 模式 CTB(Cname，Tname,， Bname) 是 否 属于 4NF。 

解 : 前 面 例 11 已 分 析 了 关系 模式 CTBE BCNF ,但 还 存在 着 数据 元 余 、. 插 入 异常 和 删 
除 异常 的 问题 。 关 系 CTB 是 全 码 , 其 中 存在 非 平凡 的 多 值 依 赖 Cname 一 一 Tname， 
Cname 习 Bname, 但 决定 因素 Cname 不 是 码 。 因 而 关系 模式 CTB 不 属于 4NF。 

在 含有 多 值 依赖 的 关系 模式 中 ,减少 数据 元 余 和 操作 异常 的 常用 方法 是 将 关系 模式 分 
解 为 仅 有 平凡 的 多 值 依赖 的 关系 模式 , 即 规范 化 为 4NF。 如 果 将 关系 模式 CTB 分 解 成 两 
个 关系 模式 CT(Cname.Tname) 和 CB(Cname, Bname) ,它们 的 属性 间 各 有 一 个 平凡 的 多 
值 依赖 Cname 一 一 Tname,Cname 一 一 Bname, 因 此 ,关系 CTE 4NF, 关 系 CBE 4NF。 同 
时 ,由 于 在 分 解 后 关系 模式 CT 及 CB 都 是 全 码 , 因 此 关系 CTEBCNF ,关系 CBE BCNF。 

通过 上 面 的 分 析 可 以 得 知 : 一 个 BCNF 的 关系 模式 不 一 定 是 4NF ,而 4NF 的 关系 模式 
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必定 是 BCNF 的 关系 模式 。 对 于 一 个 BCNF 的 关系 模式 ,利用 投影 的 方法 可 以 消去 非 平 凡 
且 非 函数 依赖 的 多 值 依赖 ,将 其 规范 为 4NF 的 关系 模式 。 

函数 依赖 和 多 位 依赖 是 两 种 最 重要 的 数据 依赖 。 如 果 仅 考虑 函数 依赖 , 则 属于 BCNF 
的 关系 模式 规范 化 程度 已 经 达到 最 高 了 ; 如 果 考 虑 多 值 依赖 , 则 属于 4NF 的 关系 模式 规范 
化 程度 是 最 高 的 。 数 据 依赖 中 除 函 数 依赖 和 多 值 依 赖 之 外 ,还 有 其 他 数据 依赖 ,例如 连接 依 
赖 。 函 数 依赖 是 多 值 依 赖 的 一 种 特殊 情况 ,而 多 值 依 赖 实际 上 又 是 连接 依赖 的 一 种 特殊 情 
况 。 存 在 连接 依赖 的 关系 模式 仍 可 能 遇 到 数据 宛 余 及 插入 .修改 、 删 除 异常 等 问题 。 对 于 属 
于 4NF 的 关系 模式 ,如 果 消 除了 其 中 存在 的 连接 依赖 , 则 可 以 进一步 达到 5NF 的 关系 模 
式 。 本 书 不 讨论 连接 依赖 和 5NF, 有 兴趣 的 读者 可 以 参阅 有 关 书 籍 。 


4.2.3 关系 模式 的 规范 化 步骤 


在 关系 数据 库 中 ,对 关系 模式 的 基本 要 求 是 满足 第 一 范式 。 在 此 基础 上 ,为 了 消除 关系 
模式 操作 中 存在 的 插入 异常 .删除 异常 ,修改 复杂 和 数据 元 余 等 问题 ,需要 对 关系 模式 进 一 
步 分 解 , 使 之 逐步 达到 更 高 程度 的 2NF、3NF、BCNF 及 4NF。 

规范 化 的 基本 原则 是 “一 事 一 地 ”的 模式 设计 原则 。 即 一 个 关系 仅 描述 一 个 概念 、 一 个 
实体 或 者 实体 间 的 一 种 联系 ,如 果 多 于 一 个 概念 就 把 它 * 分 离 " 出 去 。 规 范 化 的 过 程 实质 上 
是 对 原 关系 进行 投影 ,逐步 消除 数据 依赖 中 不 合适 的 部 分 ,使 关系 数据 库 模式 中 的 各 关系 模 
式 逐 步 达到 不 同 程度 的 分 离 的 过 程 。 关 系 规范 化 的 基本 步骤 如 图 4-5 所 示 , 对 于 一 个 非 规 
范 化 关系 的 规范 化 过 程 主要 分 为 以 下 几 步 : 

(1) 将 非 规范 化 的 关系 中 的 组 合 属性 分 解 为 不 可 再 分 的 属性 ,转换 为 INF 关系 ; 

(2) 消除 非 主 属性 对 码 的 部 分 函数 依赖 ,将 1NF 关系 分 解 为 若干 个 2NF 关系 ; 

(3) 消除 非 主 属性 对 码 的 传递 函数 依赖 ,将 2NF 的 关系 分 解 为 若干 个 3NF 的 关系 

(4) 消除 主 属性 对 码 的 部 分 函数 依赖 和 传递 函数 依赖 ,得 到 一 组 BCNF 关系 ; 

(5) 消除 非 平凡 且 非 函数 依赖 的 多 值 依赖 、 得 到 一 组 4NF 的 关系 。 


非 规范 化 的 关系 
站 分 解 组 合 属性 成 为 不 可 再 分 的 属性 
INF 
站 消除 非 主 属性 对 码 的 部 分 函数 依赖 
2NF 
站 消除 非 主 属性 对 码 的 传递 函数 依赖 
3NF 
站 消除 主 属性 对 码 的 部 分 和 传递 函数 依赖 
BCNF 
站 消除 非 平凡 且 非 函数 依赖 的 多 值 依赖 
4NF 


图 4-5 ”关系 模式 规范 化 的 基本 步骤 


一 个 数据 库 应 用 系统 的 关系 模式 达到 第 几 范 式 是 合理 的 ,应 结合 具体 应 用 环境 的 功能 
及 性 能 需求 来 确定 。 对 于 只 要 求 查询 而 不 要 求 插入 \ 删 除 等 操作 的 系统 ,操作 异常 现象 对 数 
据 库 操作 的 影响 并 不 大 ,因此 不 宜 过 度 分 解 ,否则 当 对 系统 进行 整体 查询 时 ,往往 影响 查询 
效率 。 在 实际 应 用 中 ,比较 实用 的 是 3NF 和 BCNF ,在 进行 关系 模式 的 设计 时 ,通常 分 解 到 
3NF 就 可 以 使 用 了 。 


4.3 关系 模式 的 分 解 


关系 模式 规范 化 过 程 中 采用 的 主要 方法 是 对 关系 模式 进行 分 解 。 本 节 介 绍 关系 模式 分 
解 的 理论 基础 及 关系 模式 分 解 的 算法 。 


4.3.1 关系 模式 分 解 的 理论 基础 


对 关系 模式 的 分 解 需要 确定 关系 中 的 函数 依赖 ,而 在 实际 的 数据 库 应 用 系统 中 要 确定 
所 有 可 能 的 函数 依赖 是 不 现实 的 。 因 此 有 必要 讨论 如 何 得 到 一 个 表示 完整 函数 依赖 的 最 小 

从 已 知 的 函数 依赖 推导 出 另 一 些 新 的 函数 依赖 ,需要 一 系列 推理 规则 。1974 年 W. W. 
Armstrong 提出 了 一 套 有 效 而 完备 的 公理 系统 一 一 Armstrong 公理 ,利用 该 公理 改进 后 的 
推理 规则 ,可 以 由 一 组 已 知 函 数 依赖 推导 出 关系 模式 的 其 他 函数 依赖 ,Armstrong 公理 成 为 
关系 模式 分 解 算法 的 基础 。 

1. 函数 依赖 的 迎 辑 蕴涵 

对 于 给 定 的 一 组 函数 依赖 ,要 判断 男 外 一 些 函 数 依赖 是 否 成 立 , 即 能 否 从 给 定 的 函数 依 
赖 导出 要 判定 的 函数 依赖 的 问题 ,是 函数 依赖 的 迎 辑 蕴涵 所 要 研究 的 内 容 。 例 如 ,F=={A 一 
B,B-~C}, 问 AC 是 否 成 立 ? 需要 有 关 函 数 依赖 的 逻辑 蕴涵 知识 。 

定义 4.12 对 于 满足 一 组 函数 依赖 F 的 关系 模式 R(U,F) ,其 任何 一 个 关系 +, 若 函数 
依赖 X->Y 都 成 立 ( 即 r 中 任意 两 元 组 ts, 若 tLX]=sLX], 则 tLY]=sLY]) , 则 称 下 逻辑 萄 
涵 X-~Y ,或 称 函 数 依赖 X-~Y 可 由 下 导出 。 

2. Armstrong 公理 系统 (Armstrong's axiom) 

(1) Armstrong 公理 

设 有 关系 模式 R (U,F) ,U 为 属性 集 ,F 是 UU 上 的 一 组 函数 依赖 集 ,X、Y、Z,W 均 是 U 
的 子 集 , 对 R(U,F) 来 说 函数 依赖 的 推理 规则 如 下 (为 简便 起 见 , 下 面 用 XY 表示 XUY, 依 
此 类 推 ) 。 

Q@ Al 自 反 律 (reflexivity rule): 若 Y CcX cU , 则 X->Y 为 所 蕴涵 。 

例如 ,对 关系 模式 SCCSno，Cno、 Grade) ,根据 自 反 律 有 下 列 函 数 依赖 成 立 : 

(Sno，、Cno)- 一 Cno.(Sno，Cno) 一 Sno 

@ A2 增 广 律 (augmentation rule) : 车 X>Y 为 下 所 蕴涵 , 且 Z scU, 则 XZ-~YZ 为 F 所 
蕴涵 。 

@ A3 传递 律 (transitivity rule) : 若 X->Y 及 Y-~Z 为 所 列 涵 , 则 X->~Z 为 下 所 蕴涵 。 

(2) Armstrong 公理 推理 

根据 Armstrong 公理 可 以 得 到 下 面 三 条 很 实用 的 推理 规则 。 
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@ 合并 规则 (union rule) : 由 XY,X>Z, 有 XYZ。 

例如 ,对 关系 模式 Student(Sno, Sname,Ssex,Sdept), 有 Sno>(Sname, Sdept) ,Sno-~ 
Ssex, 则 有 Sno 习 (Sname，Sdept，Ssex) 成 立 。 

@ 伪 传 递 规则 (pseudo transitivity rule): 由 X~~Y,WY-~Z, 有 XW-~Z。 

@ 分 解 规则 (decomposition rule) : 由 X->Y 及 ZcY,. 有 X-~Z。 

根据 合并 规则 和 分 解 规则 ,很 容易 得 到 这 样 一 个 重要 结论 : X Al A:…Ax 成 立 的 充分 
必要 条 件 是 X 一 Ai 成 立 (i 二 1,2,…,k)。 

(3) Armstrong 公理 是 有 效 的 和 完备 的 

Armstrong 公理 的 有 效 性 ,是 指 在 下 中 根据 Armstrong 公理 推导 出 来 的 每 一 个 函数 依 
赖 一 定 为 F 所 逻辑 蕴涵 。 

Armstrong 公理 的 完备 性 ,是 指 F 所 逻辑 蕴含 的 每 一 个 函数 依赖 ,必定 可 以 由 下 出 发 
根据 Armstrong 公理 推导 出 来 。 

Armstrong 公理 系统 的 作用 在 于 有 效 而 准确 地 计算 函数 依赖 的 迎 辑 蕴涵 , 即 由 已 知 的 
函数 依赖 推出 未 知 的 函数 依赖 。 公 理 的 有 效 性 保证 按 公理 推出 的 所 有 函数 依赖 均 为 真 , 公 
理 的 完备 性 保证 了 可 以 推出 所 有 的 函数 依赖 ,这 样 就 保证 了 计算 和 推导 的 可 靠 性 和 有 效 性 。 

3. 函数 依赖 集 闭 包 和 属性 集 闭 包 

(1) 函数 依赖 集 闭 包 

定义 4.13 在 关系 模式 R(U,F) 中 为 F 所 逻辑 强 涵 的 函数 依赖 的 全 体 叫 作 下 的 闭 包 ， 
记 为 F+。 

一 般 情况 下 ,FF* 。 如 果 FF= F+ , 则 称 下 是 函数 依赖 的 完备 集 。 

【 例 13】 已 知 关系 模式 RCA,B,C,G,H, 了 及 其 函数 依赖 集 F={A 一 B,A 一 C,CG 一 
H,CG 一 1,B>H}。 判断 A 一 H.CG 一 HI 和 AG-~>~I 是 否 属于 F* 。 

解 : 根据 Armstrong 公理 系统 : 

@ 由 于 A-~B 和 B>H, 根 据 传递 律 ,可 推出 A>H。 

@ 由 于 CG>H 和 CG>I, 根 据 合 并 规则 ,可 推出 CG 一 HI。 

@ 由 于 A-~C 和 CG-~I, 根 据 伪 传递 规则 ,可 推出 AG>I。 

因此 ,A 一 H、CG 一 HI 和 AG 一 I 均 属于 Ft*。 

(2) 属性 集 闭 包 

对 于 关系 模式 R(U) 上 的 函数 依赖 集 下 ,运用 推理 规则 可 以 推出 另外 一 些 函 数 依赖 ,FF 
逻辑 蕴涵 的 所 有 函数 依赖 构成 的 闭 包 F* 。 在 实际 项 目 中 ,人 们 往往 需要 知道 某 个 函数 
依赖 XY 是 否 成 立 , 如 果 已 经 计算 出 F* ,只 要 检查 该 函数 依赖 是 否 在 F* 中 就 能 得 到 结 
果 。 然 而 计算 F* 是 一 个 相当 复杂 且 困 难 的 问题 。 为 了 解决 这 个 问题 ,人 们 把 计算 F* 简化 
为 计算 属性 集 的 闭 包 XE# 。 首 先 确定 每 一 组 会 在 函数 依赖 X->Y 左边 出 现 的 属性 组 X, 然 后 
确定 所 有 依赖 于 X 的 属性 组 Xt ,X# 称 为 X 在 FF 下 的 闭 包 。 

判定 函数 依赖 XY 是 否 能 由 下 导出 的 问题 ,可 转化 为 求 XE 并 判定 Y 是 否 是 XE 子 
集 的 问题 。 即 求 函 数 依赖 集 闭 包 问 题 可 转化 为 求 属性 集 闭 包 问 题 。 下 面 给 出 属性 集 闭 包 
X# 的 定义 和 计算 X# 的 算法 。 

定义 4.14 设 有 关系 模式 R(U,F),U 为 R 的 属性 集 ,F 是 R 上 的 函数 依赖 集 ,X 是 如 
的 一 个 子 集 (X cU)。 用 Armstrong 公理 从 下 推出 的 函数 依赖 X 一 A 中 所 有 A 的 集合 , 称 
为 属性 集 双关 于 下 的 闭 包 , 记 为 X 或 XE , 即 : 


Xt ={A | X>AEF+} 

对 关系 模式 R(U, F) , 求 属性 集 X 相对 于 函数 依赖 集 F 的 闭 包 X# 的 算法 如 下 。 

@ 选 X 作 为 闭 包 Xt# 的 初 值 Xo 一 X,z 一 0。 

@ 如 果 下 中 有 某 个 函数 依赖 Y 一 Z 满足 Y cXz , 则 Xer 一 X2 U Z。 

图 如 果 Xe =Xc+7 或 Xe 一 U, 则 Xt 一 XO ,算法 终止 。 

@ 否则 ,一 ;十 1, 返 回 第 @ 步 。 

【 例 14】 已 知 关 系 模式 RCIU,F) ,其 中 U={A,B,C,D,E},F={(AB) 一 C,B>D,C 
E,(CE) 一 B,(AC) 一 B} ,计算 (AB)# 。 

解 : 

g@ 设 初 值 (AB) = AB。 

@ 计算 (AB)o 。 

对 于 (AB) 叫 中 的 AB, 有 (AB) 一 C; 对 于 (AB)M 中 的 B, 有 BD, 则 

(AB) = (AB)® U CD = ABCD 
对 于 (AB) 中 的 C, 有 C>E, 则 
(AB)® = (AB)®U E = ABCDE 

@ 由 于 (AB)%2 =U, 因 此 计算 完毕 。 

结果 (AB) 直 一 (AB)2 天 ABCDE={A,B,C,D,E}。 

4. 候选 码 的 求解 方法 

有 关 候 选 码 的 定义 ,本 书 4. 2 节 已 有 介绍 ,这 里 讨论 利用 属性 集 闭 包 求 解 关 系 模式 的 候 
选 码 的 方法 。 

对 于 给 定 的 关系 模式 RCA1 ,A:,…,A,) 和 函数 依赖 集 F, 可 将 其 属性 分 为 如 下 四 类 。 

四 工 类 : 仅 出 现在 下 中 的 函数 依赖 左 部 的 属性 。 

@R 类 : 仅 出 现在 F 中 的 函数 依赖 右 部 的 属性 。 

@N 类 :在 F 中 的 函数 依赖 的 左 部 和 右 部 均 不 出 现 的 属性 。 

@ LR 类 : 在 F 中 的 函数 依赖 的 左 部 和 右 部 均 出 现 的 属性 。 

对 于 R 中 的 属性 集 X 有 以 下 结论 。 

着 X 是 工 类 属性 , 则 X 一 定 包 含 在 关系 模式 R 的 任何 一 个 候选 码 中 , 若 X 包含 了 
R 的 全 部 属性 , 则 XX 为 R 的 唯一 候选 码 。 

@ 若 X 是 R 类 属性 , 则 X 不 在 R 的 任何 一 个 候选 码 中 。 

@ 车 X 是 NN 类 属性 , 则 X 一 定 包 含 在 R 的 任何 一 个 候选 码 中 。 

@ 若 X 是 LR 类 属性 , 则 XX 可 能 包含 在 R 的 某 个 候选 码 中 。 

【 例 15】 设 有 关系 模式 RCU,F), 其 中 U={A,B,C,D },F={ D>B,B>D,AD>B， 
AC-~D}, 求 R 的 所 有 候选 码 。 

解 : 分 析 下 中 的 函数 依赖 ,发 现 A、C 两 个 属性 是 工 类 属性 ,因此 A、C 两 个 属性 必定 在 
R 的 任何 一 个 候选 码 中 ; 又 由 于 (AC)+ = ABCD, 即 (AC)+ 包含 了 R 的 全 部 属性 ,因此 ， 
AC 是 R 的 唯一 候选 码 。 

【 例 16】 设 有 关系 模式 RCU,F) ,其 中 U={A,B,C,D,E },F={ A 一 BC,CD~E,B 一 
D, EA), 求 R 的 所 有 候选 码 。 

解 : DO 分 析 下 中 的 函数 依赖 ,发 现 关 系 模式 R 中 没有 工 类 、R 类 和 NN 类 属性 ,所 有 的 
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属性 都 是 LR 类 属性 。 因 此 ,依次 求 出 属性 A`.B\C、D、E 的 闭 包 : 
A+= ABCDE 
B+= BD 
CG 
Dr 二 各 
E* = ABCDE 
由 于 A+ 和 Et 都 包含 了 R 的 全 部 属性 ,因此 A 和 正 分别 是 的 一 个 候选 码 。 
@ 从 R 中 任意 取出 两 个 属性 组 成 属性 集 ,分 别 求 属性 集 的 闭 包 。 由 于 A.E 已 是 R 的 
候选 码 ,因此 分 别 求 出 属性 集 BC、BD、CD 的 闭 包 : 
(BO+= ABCDE 
(BD)+= BD 
(CD)+ = ABCDE 
因此 ,BC 和 CD 分 别 是 R 的 一 个 候选 码 。 
求解 结果 ,关系 模式 R 的 全 部 候选 键 为 : A、E、BC 和 CD。 
5. 函数 依赖 集 的 等 价 和 覆盖 
(1) 函数 依赖 集 的 等 价 的 概念 
定义 4.15 设 F 和 G 是 关系 模式 R(U) 的 两 个 函数 依赖 集 , 如 果 F+= G+ , 则 称 F 与 
G 等 价 。F 与 G 等 价 也 称 下 是 G 的 覆盖 ,或 G 是 下 的 覆盖 。 
定理 4.1 F+= G+ 的 充分 必要 条 件 是 FEGG+ 且 GSF+ 。 
(2) 判定 两 个 函数 依赖 集 等 价 的 方法 
分 析 定义 可 知 , 判 断 F 和 G 是 否 等 价 就 是 要 判断 它们 是 否 相 互 获 盖 。 要 求 同 时 检验 
FSGt+ 及 GCSF* ,如 果 两 者 都 成 立 才 能 确定 F 和 G 等 价 。 判 断 具 体 方法 是 : 
@ 在 G 上 计算 Xt ,逐一 检查 下 中 的 函数 依赖 X-~Y, 如 果 满 足 YSXda , 则 说 明 X 一 
YEG+ ,继续 检查 下 中 的 其 他 依赖 ,如 果 全 部 满足 X-~YEG+ , 则 FSG+ 。 
@ 如 果 在 检查 中 发 现 有 一 个 X 一 Y 不 属于 G+ ,就 可 以 判定 FSEG+ 不 成 立 , 则 F 和 G 
不 等 价 。 
图 如 果 已 判定 FEGG+ 成 立 , 则 同 理 判 定 GEF+ 是 否 成 立 , 如 果 成 立 , 则 可 以 判定 F 和 
G 等 价 。 
6. 函数 依赖 集 的 最 小 化 
(1) 最 小 函数 依赖 集 的 定义 
定义 4.16 ”如果 函数 依赖 集 F 满足 下 列 条 件 , 则 称 下 为 一 个 极 小 函数 依赖 集 ,也 称 为 
最 小 依赖 集 或 最 小 覆盖 。 
QF 中 任 一 函数 依赖 的 右 部 仅 有 一 个 属性 。 
@ F 中 不 存在 这 样 的 函数 依赖 X 一 A, 使 得 F 与 F 一 {X 一 A} 等 价 。 
图 下 中 不 存在 这 样 的 函数 依赖 X->A,X 有 真子 集 Z 使 得 F 一 {X 一 A} U {ZA} 与 F 
等 价 。 
以 上 定义 中 条 件 〇 要求 在 最 小 函数 依赖 集中 的 所 有 函数 依赖 都 应 该 是 “ 右 端 没有 多 余 
的 属性 ”的 最 简单 的 形式 ; 条 件 @@ 要 求 最 小 函数 依赖 集中 无 多 余 的 函数 依赖 ; 条 件 @ 要 求 
最 小 函数 依赖 集中 的 每 个 函数 依赖 的 左 端 没有 多 余 的 属性 。 


【 例 17】 设 有 如 下 两 个 函数 依赖 集 Fi 、F; ,分 别 判断 它们 是 否 是 极 小 函数 依赖 集 。 
Fi= {AB—>CD,BE~>C,C—>G} 
Fs= {A—>D,B—>A,A—C,B>D,D—>C} 

解 : D 由 于 Fi 中 函数 依赖 AB 一 CD 的 右 部 不 是 单个 属性 ,因此 ,函数 依赖 集 F 不 是 
极 小 函数 依赖 集 。 

@ 由 于 F; 中 A~>C 可 由 A>>D 和 D>C 导 出 ,因此 AC 是 F, 中 的 多 余 函 数 依赖 ,所 
以 F, 也 不 是 极 小 函数 依赖 集 。 

(2) 最 小 函数 依赖 集 的 求法 

定理 4.2 每 一 个 函数 依赖 集 均等 价 于 一 个 极 小 函数 依赖 集 Fu。 ,此 F。 称 为 下 的 最 
小 依赖 集 。 

证 明 : 这 是 一 个 构造 性 的 证 明 , 分 三 步 对 下 进行 极 小 化 处 理 , 找 出 下 的 一 个 最 小 依赖 
集 。 证 明 的 过 程 也 是 计算 最 小 函数 依赖 集 的 算法 。 

@ 使 F 中 每 个 函数 依赖 的 右 部 都 只 有 一 个 属性 。 

逐一 检查 下 中 各 函数 依赖 X 一 Y, 若 Y= 二 AlAs…Ai(k 宇 2), 则 用 {X 一 Aj|1j 二 1,2,…k} 
取代 X>Y。 

@ 去 掉 多 余 的 函数 依赖 。 

逐一 检查 下 中 各 函数 依赖 X 一 A, 令 G=F 一 {X-~A)}, 若 AEXc+ , 则 从 FF 中 去 掉 X 一 A 
函数 依赖 。 

人 去 掉 各 函数 依赖 左 部 多 余 的 属性 。 

逐一 取出 下 中 各 函数 依赖 X 一 A, 设 X=BiB,…B, ,逐一 检查 B, (i 二 1,2,…,m) ,如果 
AE(X 一 Bi)t, 则 以 X 一 B; 取代 X。 

综 上 所 述 ,对 下 的 每 一 步 处 理 都 保证 了 处 理 前 后 的 两 个 函数 依赖 集 等 价 , 最 后 得 到 的 下 
就 一 定 是 极 小 依赖 集 , 并 且 与 原来 的 F 等 价 。 

F 的 最 小 依赖 集 Fu 不 一 定 是 唯一 的 , 它 与 对 各 函数 依赖 及 X-~~A 中 X 各 属性 的 处 置 
顺序 有 关 。 

【 例 18】 设 有 关系 模式 R(U,F),U={A,B,C}), F={AB 一 C,A 一 B,B 一 A), 求 其 最 
小 函数 依赖 集 Fu 。 

解 : 
@O 将 下 中 的 函数 依赖 都 分 解 为 右 部 为 单 属性 。F 已 满足 该 条 件 , 不 需要 再 分 解 。 
@ 去 掉 下 中 元 余 的 函数 依赖 。 
判断 AB-~C 是 否 元 余 : 
设 G={A 一 B,B 一 A}, 则 (AB)at+ = 二 AB,C 不 属于 (AB)a1+ ,AB>C 不 元 余 。 
判断 A 一 B 是 否 宛 余 : 
设 Gs={ AB-~C,B-~A }, 则 Aos1+ 一 A,B 不 属于 Ac+ ,A-~B 不 宛 余 。 
判断 B~~A 是否 宛 余 : 
设 G;=={ AB~C,A 一 B }, 则 Bos+ = 二 B,A 不 属于 Bos+ ,B 一 A 不 元 余 。 
F 中 没有 元 余 的 函数 依赖 ,F 保持 不 变 。 
@ 去 掉 各 函数 依赖 左 部 元 余 的 属性 。 本 题 只 需 考虑 AB-~C 的 情况 。 
方法 1: 在 决定 因素 中 去 掉 B, 若 CEA , 则 以 A 一 C 代替 AB-~C。 求 得 A# 二 ABC。 
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由 于 CEAt ,因此 用 A 一 C 代替 AB-~C。 故 Fu 王 {(A 一 C,A 一 B,B 一 A)} 。 
方法 2: 在 决定 因素 中 去 掉 A, 若 CEBt , 则 以 B->C 代替 AB->C。 求 得 Bi 二 ABC。 
由 于 CEHBt ,因此 以 B->C 代替 AB-~C。 故 F。 一 {B-~C,A-~B,B-~A)}。 


4.3.2 关系 模式 的 分 解 算法 


1. 模式 分 解 的 无 损 连 接 性 和 保持 函数 依赖 性 

关系 模式 规范 化 的 方法 就 是 进行 模式 分 解 , 但 分 解 后 产生 的 模式 应 与 原 模 式 等 价 , 即 模 
式 分 解 应 当 遵守 一 定 的 准则 ,才能 保证 分 解 后 的 模式 规范 化 程度 更 高 。 为 了 使 分 解 前 后 的 
模式 等 价 , 从 不 同 的 角度 出 发 ,形成 了 不 同 的 模式 分 解 准则 。 

@ 分 解 具 有 无 损 连 接 性 (lossless join) 。 

@ 分 解 能 够 保持 函数 依赖 (preserve functional dependency) 。 

@ 分 解 既 具 有 无 损 连接 性 又 能 保持 函数 依赖 。 

下 面 介绍 分 解 的 无 损 连接 性 和 保持 函数 依赖 性 的 定义 及 其 判定 方法 。 

在 介绍 分 解 无 损 连 接 性 和 保持 函数 依赖 性 的 定义 之 前 ,首先 定义 一 个 记号 。 

定义 4.17 设 p={Ri1(Ui,F1) ,Rs(Us ,Fs),…,Ri(Ui ,Fi)} 是 RC(U,F) 的 一 个 分 解 ,r 
是 RC(U,F) 的 一 个 关系 。 定 义 m,(r) 二 Bq IIri(r) ,i 二 1,k。 即 mr(Cr) 是 r 在 po 中 各 关系 模式 
上 投影 的 连接 。 其 中 IIr;(r) 表 示 r 在 模式 Ri 属性 上 的 投影 。 

(1) 模式 分 解 的 无 损 连 接 性 

定义 4.18 设 o={Ri(CU,F,),R:(U:,F:),…,ReCU ,Fi)) 是 RCIU,F) 的 一 个 分 解 ， 
若 对 RCU,F) 的 任何 一 个 关系 r 均 有 上 r= ms(r) , 则 称 分 解 bp 具有 无 损 连接 性 ,简称 p 为 无 损 
分 解 。 

判定 一 个 分 解 具有 无 损 连 接 性 的 方法 是 : 

设 o={Ri CU,F,),Rz (Us,F:),… ,ReCUs,F)} 是 RCIU,F) 的 一 个 分 解 ,U={Ai， 
As,.…,A,}.。 

O 首先 建立 一 张 n 列 k 行 的 表 , 每 一 列 对 应 一 个 属性 ,每 一 行 对 应 分 解 中 的 一 个 关系 
模式 。 若 属性 A; 属于 U;, 则 在 j 列 i 行 交 又 处 填 上 ai 否则 填 上 by 。 

@ 根据 F 中 每 一 个 函数 依赖 (例如 X 一 Y) 修 改 表 的 内 容 。 修 改 规则 为 : 在 z 所 对 应 的 
列 中 ,寻找 相同 符号 的 那些 行 ; 在 这 些 行 上 使 属性 Y 所 在 列 的 (7 元 素 相 同 , 若 其 中 有 a , 则 
全 部 改 为 a ; 否则 全 部 改 为 by ; m 是 这 些 行 的 行 号 最 小 值 。 若 某 个 by 被 更 改 , 那 么 该 表 的 
7 列 中 凡是 by 的 符号 (不 管 它 是 否 是 开始 找到 的 那些 行 ) 均 应 作 相应 的 更 改 。 

@ 最 后 判断 ,在 某 次 更 改 之 后 ,如 果 有 一 行 成 为 a ，as,… ,a, , 则 算法 终止 ,p 具有 无 损 
连接 性 ; 否则 p 不 具有 无 损 连 接 性 。 对 所 有 函数 依赖 都 这 样 处 理 一 次 ,前 后 进行 比较 ,观察 
表 是 否 有 变化 。 如 有 变化 , 则 返回 第 @ 步 ,否则 算法 终止 。 

【 例 19】 设 RCU,F), U={A, B,C, D), F={A 一 B, BC, C~D}), R 的 一 个 分 解 
为 RiCA,B)、R; (B,C)、Rs(C,D)。 判 断 该 分 解 是 否 具有 无 损 连接 性 。 

解 : 

@ 构造 初始 表 , 详 见 表 4-9(a)。 


@ 对 函数 依赖 A 一 B, 因 元 素 A 的 第 1 列 没有 相同 的 分 量 , 所 以 表 不 改变 。 由 B-~C 可 
以 把 bis 改 为 as ,再 由 C-~D 可 以 将 bu 、b 全 部 改 为 a 。 最 后 结果 见 表 4-9(b)。 表 中 第 1 
行 成 为 na、asz \as .at ,所 以 该 分 解 具有 无 损 连接 性 。 


表 4-9 
分 解 具有 无 损 连 接 的 实例 初始 表 (a) 
A B C D 
an az bs bi 
bs az as bs, 
bs bs as a 
分 解 具有 无 损 连接 的 实例 结果 表 (b) 
A B C D 
al az as a 
ba az as a 
bs bs: as a 


利用 下 面 的 定理 ,可 以 判断 当 一 个 关系 R 分 解 成 R 和 R。 两 个 关系 时 ,其 分 解 是 否 具 
有 无 损 连接 性 。 

定理 4.3 R(U,F) 的 一 个 分 解 0 二 {Ri(Ui ,Fi),R; (Us ,Fs)}) 具 有 无 损 连接 性 的 充分 
必要 条 件 是 : 

如 Us 一 咒 一 Uz EF+ 或 UnuU: 一 U: 一 UEF+ 

【 例 20】 设 有 关系 模式 R(X,Y,2) ,基于 R 的 函数 依赖 集 F=={X 一 Y)}。 判 断 以 下 有 

关 R 的 两 个 分 解 是 否 为 无 损 连 接 。 
p={Ri(X,Y),R:(X,2)} 
p={Rs(X,Y),R(Y,2)} 

解 : 

因为 RNR。=XYNXZ=X,R, 一 R: 一 XY 一 XZ 一 Y, 已 知 X->Y, 所 以 Ri 站 R, 一 
(Ri 一 Rs) 成 立 。 

因此 ,pi 二 {Ri(X,Y) ,R(X.2Z)}) 是 无 损 分解 。 

@ 因为 RNMR=XYN YZ=Y,R,s 一 R= 二 XY 一 YZ=X, 所 以 ,已 知 X>Y, 所 以 RMR 一 
(R; 一 Ri ) 不 成 立 。 

因此 ,p= 二 {Ri(X,Y) ,Rs(X.2Z)}) 不 是 无 损 分 解 。 

(2) 模式 分 解 的 保持 函数 依赖 性 

定义 4.19 设 p={Ri(Di,F1),Rz (Us,F:),…,Ri(U ,Fi)} 是 RC(U,F) 的 一 个 分 解 ， 
车 F+ 二 (UF;)+ ,i 二 1,k, 则 称 分 解 p 保持 函数 依赖 。 

其 中 ,F; 是 在 U; 上 的 投影 。 利 用 定理 4.1, 可 以 判定 F+ 二 (UF)+ 是 否 成 立 , 判 定 
分 解 。 是 否 具有 保持 函数 依赖 性 。 

【 例 21】 设 有 关系 模式 R(U,F), 其 中 U= {Sno,Sdept, Mname),F== {Sno 一 Sdept， 
Sdept 一 Mname) ,判断 分 解 0 二 {Ri1(Sno,Sdept) ,R; (Sdept, Mname)) 是 否 具有 无 损 连接 性 
及 保持 函数 依赖 性 。 
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解 : (1) 判断 po 是否 具有 无 损 连 接 性 。 由 于 
Ri 站 R: 王 (CSno,Sdept) 门 (CSdept,Mname) 一 Sdept 
了 R: 一 Ri 一 (Sdept,Mname) 一 (Sno,Sdept) 一 Mname 
Ri 门 R: 一 R: 一 Ri 王 Sdept~MnameEF+ 
因此 分 解 p 具有 无 损 连 接 性 。 
(2) 判断 6 是 否 具有 保持 函数 依赖 性 。 由 于 
Fi= {Sno>Sdept} ,F,= { Sdept>Mname} 
FiUF,;={ Sno>Sdept,Sdept>Mname }=F 
因此 分 解 p 具有 保持 函数 依赖 性 。 
2. 模式 分 解 的 算法 
前 面 已 介绍 了 3 种 不 同 的 模式 分 解 准 则 ,按照 不 同 的 分 解 准则 ,模式 分 解 后 将 达到 不 同 
的 分 离 程度 , 即 达到 不 同 的 范式 。 下 面 讨论 几 种 满足 不 同 的 分 解 准则 的 模式 分 解 的 算法 。 
(1) 将 关系 模式 转化 为 3NF 的 保持 函数 依赖 的 分 解 
对 于 给 定 的 关系 模式 RCU,F) ,将 其 转化 为 3NF 保持 函数 依赖 的 分 解 算法 为 : 
@ 对 R(U,F) 中 的 下 进行 极 小 化 处 理 。 假 设 极 小 化 处 理 后 的 函数 依赖 集 仍 为 下 。 
@ 找 出 所 有 不 在 F 中 出 现 的 属性 ,把 这 样 的 属性 构成 一 个 关系 模式 ,并 把 这 些 属性 从 
U 中 去 掉 。 
G 如 果 下 中 有 一 个 函数 依赖 涉及 R 的 全 部 属性 , 则 R 不 能 再 分 解 。 
@ 如 果 下 中 含有 X-~A, 则 分 解 应 包含 模式 XA, 如 果 X 一 Al,X 一 A,,…,X 一 A,, 均 属 
于 下 , 则 分 解 应 包含 模式 XAlAs…A,。 
(2) 将 关系 转化 为 3NF, 且 既 具 有 无 损 连 接 性 又 能 保持 函数 依赖 的 分 解 
对 于 给 定 的 关系 模式 R(U,F) ,将 其 转换 为 3NF, 且 既 具 有 无 损 连 接 性 又 能 保持 函数 依 
赖 的 分 解 算法 为 : 
@ 设 X 是 RC(U,F) 的 码 ,R(U,F) 已 由 上 述 分 解 算法 分 解 为 p= {Ri (CU ,Fi),R;(U;， 
Fa) ,Ri(Ui ,Fi), 令 t=pU {R* (X,Fx)}。 
@ 若 有 某 个 U;,XSSU;, 将 R(X,Fx) 从 zt 中 去 掉 ,t 就 是 所 求 的 分 解 。 
(3) 将 关系 模式 转换 为 BCNF 的 无 损 连 接 的 分 解 
对 于 给 定 的 关系 模式 RCU,F) ,将 其 转换 为 BCNF 的 无 损 连 接 分 解 算法 为 : 
四 令 o= R(U,F)。 
@ 检查 p 中 各 关系 模式 是 否 均 属于 BCNF。 若 是 , 则 算法 终止 。 
@ 假设 op 中 Ri(CUi,Fi) 不 属于 BCNF ,那么 必定 有 X~AEEFt(AEX), 且 X 非 Ri 的 
码 。 因 此 ,XA 是 U; 的 真子 集 。 对 R; 进行 分 解 ,o 二 {Si, S;) ,Us 一 XA,Us 一 Ui 一 {A}, 以 
6 代替 Ri(Ui,F;) ,返回 第 @ 步 。 
【 例 22】” 设 关系 模式 R(U,F),U= {Sno,Cno,Grade, Thname ,Dept},F 王 {(Sno,Cno) 一 
Grade,Cno 一 Tname,Tname 一 Dept) ,将 其 分 解 为 具有 无损 连接 性 的 BCNF 。 
解 : 初始 化 6 二 {Sno,Cno,Grade, Tname,Dept}。 
@ 对 R 进行 分 解 。R 的 码 为 (Sno,Cno) ,选择 “Tname 一 Dept” 分 解 。 
分 解 结 果 : p 二 {Ri,R,)。 


其 中 Ri 二 { Tname,Dept}),F, 一 {Tname-Dept}; 

R;={Sno,Cno,Grade, Tname},F,={(Sno.Cno)—>Grade,Cno—>Tname)}.。 

因此 Rs。 需要 再 分 解 。 

图 对 R; 分 解 。R， 的 码 为 (Sno,Cno) ,选择 "Cno 一 Tname” 分 解 。 

分 解 结果 : o 一 { Ri ,Rs,R,)。 

其 中 : Rs 二 { Cno,Tname } ,Fs 二 { Cno>Tname}); 

R={ Sno,Cno,Grade },F,={(Sno,Cno)—>Grade }。 

因此 R; 、R, 均 属于 BCNF 。 

@ 最 终结 果 : p={(Tname,Dept),(Cno, Tname),(Sno,Cno,Grade)}., 

(4) 关系 模式 分 解 的 几 点 结论 

经 过 以 上 几 种 分 解 算法 的 分 析 , 如 果 一 个 分 解 具有 无 损 连 接 性 , 则 能 够 保证 不 丢失 信 
息 ; 如 果 一 个 分 解 具有 函数 依赖 保持 性 , 则 可 以 减轻 或 解决 各 种 异常 情况 。 无 损 连 接 性 和 
函数 依赖 保持 性 是 两 个 相互 独立 的 标准 。 具 有 无 损 连 接 性 的 分 解 不 一 定 具 有 函数 依赖 保持 
性 ; 同样 ,具有 函数 依赖 保持 性 的 分 解 也 不 一 定 具 有 无 损 连 接 性 。 综 合 上 述 模 式 分 解 准则 
及 模式 分 解 算法 的 分 析 , 关 于 关系 模式 的 分 解 有 以 下 结论 。 

@ 若 要 求 分 解 保 持 函 数 依赖 , 则 模式 分 解 总 可 以 达到 3NF ,但 不 一 定 达到 BCNF 。 

@ 若 要 求 分 解 具有 无 损 连 接 性 , 则 模式 分 解 一 定 可 以 达到 BCNF 。 

@ 若 要 求 分 解 既 保持 函数 依赖 ,又 具有 无 损 连 接 性 ,那么 模式 分 解 一 定 可 以 达到 3NF， 
但 不 一 定 达到 BCNF 。 


4.4 小 结 


本 章 讲 述 的 关系 模式 的 规范 化 设计 理论 是 数据 库 设 计 的 理论 指南 ,主要 包括 两 方面 内 
容 : 关系 模式 规范 化 理论 和 关系 模式 的 分 解 方法 。 

本 章 首先 通过 实例 论述 了 关系 模式 规范 化 的 必要 性 。 由 关系 模式 的 操作 异常 问题 引出 
了 数据 依赖 的 概念 ,介绍 了 完全 函数 依赖 、 部 分 函数 依赖 、 传 递 函 数 依赖 及 多 值 依赖 的 相关 
概念 。 重 点 介绍 了 第 一 范式 、 第 二 范式 、 第 三 范式 .BC 范式 、 第 四 范式 的 定义 及 关系 模式 规 
范 化 的 过 程 。 一 个 低 一 级 范式 的 关系 模式 ,通过 模式 分 解 转 化 为 若干 个 高 一 级 范式 的 关系 
模式 的 集合 ,这 种 分 解 过 程 称 为 关系 模式 的 规范 化 。 关 系 模式 规范 化 就 是 对 原 关 系 进行 投 
影 ,消除 决定 属性 不 是 候选 码 的 任何 函数 依赖 。 一 个 关系 只 要 其 分 量 都 是 不 可 分 的 数据 项 ， 
就 可 称 作 规 范 化 的 关系 , 称 为 第 一 范式 ,也 称 作 1NF; 消除 INF 关系 中 非 主 属性 对 码 的 部 
分 函数 依赖 ,得 到 2NF; 消除 2NF 关系 中 非 主 属性 对 码 的 传递 函数 依赖 ,得 到 3NF; 消除 
3NF 关系 中 主 属性 对 码 的 部 分 函数 依赖 和 传递 函数 依赖 ,得 到 一 组 BCNF 关系 ; 消除 非 平 
凡 且 非 函 数 依赖 的 多 值 依赖 , 则 得 到 4NF 关系 。 函 数 依赖 和 多 值 依赖 是 两 种 最 重要 的 数据 
依赖 。 如 果 仅 考虑 函数 依赖 , 则 属于 BCNF 的 关系 模式 规范 化 程度 已 经 达到 最 高 了 ; 如 果 
考虑 多 值 依赖 , 则 属于 4NF 的 关系 模式 规范 化 程度 是 最 高 的 。 

关系 模式 规范 化 过 程 中 采用 的 主要 方法 是 对 关系 模式 进行 分 解 。 本 章 介绍 了 关系 模式 
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分 解 的 理论 基础 及 关系 模式 分 解 的 算法 。 模 式 分 解 的 理论 基础 主要 介绍 了 函数 依赖 的 逻辑 
蕴涵 、Armstrong 公理 系统 、 闭 包 及 候选 码 的 求解 方法 、 函 数 依赖 集 的 等 价 和 覆盖 及 函数 依 
赖 集 的 最 小 化 等 ; 关于 关系 模式 分 解 的 算法 ,首先 介绍 了 模式 分 解 的 无 损 连接 性 和 保持 函 
数 依赖 性 的 含义 及 判定 方法 ,然后 讨论 了 几 种 常用 的 关系 模式 分 解 的 算法 。 

在 关系 模式 规范 化 过 程 中 ,数据 规范 化 程度 越 高 ,数据 的 宛 余 就 越 少 ,在 数据 操作 过 
程 中 人 为 产生 的 错误 也 就 越 少 。 但 规范 化 程度 越 高 ,查询 检索 所 要 查询 的 关联 也 就 越 
多 ,耗费 的 时 间 就 越 长 。 一 个 实际 应 用 系统 的 数据 库 模式 规范 到 第 几 范 式 是 合理 的 ,应 
该 根据 数据 库 的 实际 需求 情况 ,选择 一 个 折 中 的 规范 化 程度 。 实 际 上 ,第 三 范式 已 经 做 
到 了 数据 库 中 数据 在 拥有 函数 依赖 时 ,不 会 在 数据 操作 过 程 中 产生 人 为 错误 ,而 且 数 据 
访问 的 关联 也 不 至 于 过 多 ,所 以 ,通常 规范 到 3NF 就 能 满足 关系 数据 库 的 基本 要 求 , 可 以 
正常 使 用 了 。 


习 题 


1. 解释 下 列 术语 的 定义 : 

函数 依赖 平凡 函数 依赖 、 非 平凡 函数 依赖 、 部 分 函数 依赖 、 完 全 函数 依赖 ,传递 依赖 , 候 
选 码 、 超 码 、 主 码 、 外 码 、 全 码 (all-key) ,1NF、2NF、3NF、BCNF、 多 值 依赖 .4NF。 

2. 关系 规范 化 中 的 操作 异常 有 哪些 ? 解决 的 办 法 是 什么 ? 

3. 指出 下 列 各 关系 模式 属于 第 几 范式 : 

(1) R=({A, B，C,D),{B->D，AB-~C)) 

(2) R:=({A, B, C, D, E},{AB—>CE, E>AB, C—>D}) 

(3) Rs=({A, B, C, D },{A—C, D>B}) 

(4) Ri,=({A, B, C, D},{A—>C, CD—>B}) 

4. 简 述 关系 模式 规范 化 的 过 程 。 

5. 设 有 关系 模式 R(A ,B,C,D,E) ,如 果 存 在 函数 依赖 A 一 B,BC 一 D, DE 一 A, 回 答 下 
列 问题 : 

(1) 列 出 R 的 所 有 码 。 

(2) R 属于 3NF 还 是 BCNF。 

6. 试 写 出 二 个 多 值 依 赖 的 实例 。 

7. 建立 一 个 关于 系 、 学 生 、 班 级 等 诸 信 息 的 关系 数据 库 。 

描述 学 生 的 属性 有 学 号 、 姓 名 、 性 别 、 系 名 、 班 号 、 宿 舍 区 ; 

描述 班级 的 属性 有 班 号 、 专 业 名 、 系 名 、 人 数 ; 

描述 系 的 属性 有 系 名 、 系 号 、 系 办 公 室 地 点 、 系 办 公 室 电话 、 学 生 人 数 。 

有 关 语 义 如 下 : 一 个 系 有 若干 专业 ,每 个 专业 每 年 只 招 一 个 班 ,每 个 班 有 若干 学 生 。 一 
个 系 的 学 生 住 在 同一 宿舍 区 。 

请 给 出 数据 库 的 关系 模式 , 写 出 每 个 关系 的 极 小 函数 依赖 集 , 指 出 是 否 存在 传递 函数 依 
赖 ,对 于 函数 依赖 左 部 是 多 属性 的 情况 ,讨论 函数 依赖 是 完全 函数 依赖 还 是 部 分 函数 依赖 。 


指出 各 关系 的 候选 码 及 外 码 。 
8. 设 有 如 表 4-10 所 示 的 关系 R。 试问 R 是 否 属于 3NF? 若 不 是 , 它 属于 第 几 范式 ? 
如 何 规范 化 为 3NF? 


表 4-10 关系 R 实例 数据 表 


职工 号 职工 名 年 龄 性 别 单位 号 单位 名 
Gl XUHAO 26 男 MI NAMEI1 
G2 LUIA 30 女 M2 NAME2 
G3 LIUXU 35 男 M3 NAME3 
G4 SUHONG 32 女 MI NAMEI1 
G5 ZHAOBIN 28 男 M3 NAME3 


9. 设 有 关系 模式 (A,B,C,D) ,数据 依赖 集 F={A-~B,B-~A,AC-~~D,BC-~D,AD-~~C， 
BD>C,A—>—CD,B>—>CD} 

(1) 求 R 的 主 码 。 

(2) R 是 否 为 4NF? 为 什么 ? 

(3) R 是 否 为 BCNF? 为 什么 ? 

(4) R 是 否 为 3NF? 为 什么 ? 

10. 设 有 关系 模式 R(U,F) ,属性 集 U=={A,B,C,D,E), 函 数 依赖 集 F={A 一 C,C 一 
A,CD 一 E,A 一 B) , 求 闭 包 Dt+ ,C+ ,A+ ,(CD)+ ,(AD)+,(AC)+ ,(ACD)+。 

11. 已 知 关 系 模式 R 的 全 部 属性 集 U={A,B,C,D,E,G}) 及 函数 依赖 集 F== {AB 一 
C,,C>A,BC>D,ACD>B,D>EG,BE 一 C,CG 一 BD,CE 一 AG), 求 属性 集 闭 包 (BD)+ 。 

12. 求 以 下 给 定 关系 模式 的 所 有 候选 码 。 

(1) 关系 模式 R(A,B,C,D,E,P) ,其 函数 依赖 集 F={A 一 B,C 一 P,E 一 A,CE 一 D}。 

(2) 关系 模式 R(C,T,S,N,G) ,其 函数 依赖 集 F={C 一 T,CS 习 G,S 一 N})。 

(3) 关系 模式 R(C,S,2) ,其 函数 依赖 集 F={(C,S) 一 Z,Z 一 C)。 

(4) 关系 模式 R(S,D,I,B,O,Q) ,其 函数 依赖 集 F={1S-~D,I~B,B-~0,0 一 Q,Q-~O)。 

13. 设 有 关系 模式 R(A,B,C,D,E),R 的 函数 依赖 集 F={A-~~D,E~~D,D-~B,BC-~D， 
CD—>A}。 

(1) 求 R 的 候选 码 。 

(2) 将 及 分解 为 3NF。 

14. 设 有 关系 模式 RC(U,F), 其 中 U={E, F, G, H}, F={E~>G, G>E, F~~>EG,， 
HEG, FH 一 E} , 求 F 的 最 小 依赖 集 。 

15. 关系 模式 的 分 解 的 含义 ? 为 什么 要 进行 关系 模式 分 解 ? 模式 分 解 应 遵守 什么 
准则 ? 

16. 解释 模式 分 解 的 无 损 连 接 性 及 函数 依赖 保持 性 的 含义 。 

17. 设 有 关系 模式 R(A,B,C,D) ,函数 依赖 F={A 一 C,C 一 A,B 一 AC,D>AC} 

(1) 求 团 包 B+ ,(AD)1 。 

(2) 求 出 R 的 所 有 候选 码 。 

(3) 求 出 F 的 最 小 函数 依赖 集 F。 。 


地 上 由 


关系 模式 的 规范 化 设计 理论 


数据 库 原 理 及 应 用 教程 一 -SQL Server 2014 


(4) 根据 函数 依赖 关系 ,确定 关系 模式 R 属于 第 几 范式 。 

(5) 将 RR 分 解 为 3NF, 并 保持 无 损 连接 性 和 函数 依赖 性 。 

(6) 将 R 分 解 为 BCNF ,并 保持 无 损 连 接 性 。 

18. 设 有 关系 模式 RC(U,V,W,X,Y,2), 其 函数 依赖 集 F= (1U 一 V,W 一 2Z,Y 一 U， 
WY 一 X} ,判断 下 列 分 解 是 否 具 有 无 损 连 接 性 : 

(1) p={WZ, W, WXY, UV)} 

(2) p: ={WY, WXYZ} 


第 5 章 数据 库 设计 


【本 章 主要 内 容 】 

1. 简 述 数据 库 设计 的 特点 .方法 和 步骤 。 

2. 详细 介绍 数据 库 设计 各 阶段 的 任务 及 方法 。 

3. 重点 讲述 概念 结构 设计 和 逻辑 结构 设计 的 方法 和 步骤 。 


上 一 章 介 绍 的 关系 模式 的 规范 化 设计 理论 为 数据 库 设 计 提供 了 理论 指南 和 工具 ,本 章 
主要 讨论 基于 关系 数据 库 管理 系统 的 关系 数据 库 设 计 间 题 。 首 先 概述 数据 库 设计 的 特点 、 
方法 及 步骤 ; 然后 详细 介绍 数据 库 设计 各 阶段 的 任务 及 方法 ,通过 实例 重点 讲解 概念 结构 
设计 和 好 辑 结构 设计 的 具体 方法 ; 最 后 阐述 如 何 对 已 设计 的 数据 库 进 行 实施 和 维护 。 


5.1 数据 库 设计 概述 


随 着 计算 机 技术 及 通信 技术 的 发 展 , 信 息 时 代 悄 然而 至 ,为 了 充分 开发 和 利用 信息 资 
源 , 实 现 对 大 量 信息 的 识别 存储、 处理 与 传播 ,20 世纪 60 年 代 末 数 据 库 技术 应 运 而 生 , 目 
前 已 广泛 应 用 于 各 个 领域 。 

数据 库 技 术 主 要 研究 如 何 科学 地 组 织 和 存储 数据 ,如 何 高 效 地 获取 和 处 理 数据 ,数据库 
设计 是 数据 库 技术 的 核心 内 容 。 本 书 第 1 章 已 介绍 了 数据 库 相关 的 基本 概念 。 数 据 库 系统 
是 指引 入 数据 库 的 计算 机 系统 ,主要 包括 系统 相关 硬件 数据库、 数据 库 管 理 系 统 及 其 开发 
工具 、 应 用 系统 数据 库 管理 员 和 用 户 , 因 此 数据 库 系统 的 设计 包括 数据 库 的 设计 和 数据 库 
应 用 系统 的 设计 。 数 据 库 设计 是 指 设计 数据 库 的 结构 特性 , 即 为 特定 的 应 用 环境 构造 最 优 
的 数据 模型 ; 数据 库 应 用 系统 的 设计 是 指 设计 出 满足 各 种 用 户 对 数据 库 应 用 需求 的 应 用 程 
序 , 用 户 通过 应 用 程序 来 访问 和 操作 数据 库 。 

综 上 所 述 ,数据 库 设计 是 在 给 定 的 应 用 环境 下 ,利用 现 有 的 数据 库 管理 系统 ,构建 优化 
的 数据 库 逻 辑 模 式 和 物理 结构 ,并 建立 数据 库 及 其 应 用 系统 ,使 应 用 系统 能 够 有 效 地 存储 和 
管理 数据 ,满足 系统 内 各 类 用 户 的 应 用 需求 。 

本 章 主要 讨论 基于 关系 数据 库 管理 系统 的 关系 数据 库 设 计 问题 ,关于 数据 库 应 用 系统 
设计 的 相关 问题 ,本 书 第 10 章 通过 一 个 完整 的 应 用 实例 进行 了 详细 论述 。 


5.1.1 数据 库 设计 的 将 点 


数据 库 设计 是 整个 数据 库 系 统 设计 的 基础 ,数据 库 设计 的 优 劣 直接 影响 数据 库 系统 的 
质量 和 运行 效果 。 因 此 ,设计 一 个 结构 优化 的 数据 库 是 对 数据 进行 有 效 管理 的 前 提 和 正确 
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利用 信息 的 保证 。 数 据 库 设计 的 过 程 贯穿 于 数据 库 应 用 系统 从 设计 、 实 施 到 运行 与 维护 的 
全 过 程 ,具有 区 别 于 一 般 应 用 系统 设计 的 一 些 特点 ,主要 表现 在 两 个 方面 。 

1. 数据 库 设 计 过 程 复杂 (技术 和 管理 相 结 合 ) 

数据 库 设计 是 设计 数据 库 本 身 , 即 根据 用 户 的 需求 ,在 某 一 具体 的 数据 库 管理 系统 中 设 
计数 据 库 的 结构 和 建立 数据 库 的 过 程 。 现 实 世 界 中 的 信息 要 进入 机 器 世界 的 数据 库 中 , 需 
要 数据 库 设 计 人 员 经 过 认识 、 理 解 、 抽 象 . 整 理 , 规 范 和 加 工 等 一 系列 复杂 的 工作 。 在 设计 过 
程 中 ,现实 世界 中 的 信息 需要 经 过 客观 世界 一 信息 世界 一 数据 世界 的 二 级 抽象 形成 计算 机 
世界 中 的 数据 结构 ,从 用 户 的 应 用 需求 人手 ,伴随 着 数据 库 设计 的 不 同 阶段 形成 数据 库 的 各 
级 模式 。 如 在 需求 分 析 阶 段 综 合 各 个 用 户 的 应 用 需求 ; 在 概念 结构 设计 阶段 形成 独立 于 机 
器 特点 ` 独 立 于 各 个 关系 数据 库 管 理 系 统 产品 的 概念 模式 ,本 章 中 概念 模式 用 E-R 图 描述 ; 
在 迎 辑 结构 设计 阶段 将 E-R 图 转换 成 具体 的 数据 库 产品 支持 的 数据 模型 ,如 关系 模型 , 形 
成 数据 库 逻 辑 模式 ; 然后 根据 用 户 处 理 的 要 求 及 安全 性 的 考虑 ,在 基本 表 的 基础 上 再 建立 
必要 的 视图 ,形成 数据 的 外 模式 ; 在 物理 结构 设计 阶段 ,根据 关系 数据 库 管 理 系 统 的 特点 和 
处 理 的 需要 进行 物理 存储 安排 ,建立 索引 ,形成 数据 库 内 模式 。 

在 上 述 复杂 的 设计 过 程 中 , 既 包 含 计算 机 专业 知识 又 包含 应 用 系统 的 专业 知识 ,数据 库 
设计 工作 需要 同时 解决 技术 及 非 技术 两 方面 的 问题 。 由 于 同时 具备 数据 库 和 业务 两 方面 知 
识 的 人 很 少 ,因此 ,数据 库 设计 者 一 般 都 需要 花费 相当 多 的 时 间 去 熟悉 应 用 业务 系统 知识 ， 
这 一 过 程 很 繁杂 ,应 用 环境 中 的 业务 人 员 不 了 解 计 算 机 具体 可 以 解决 哪些 问题 ,因此 与 之 沟 
通 需要 极 大 的 耐心 ,有 时 会 使 设计 人 员 产 生 厌 烦 情 绪 ,从 而 影响 数据 库 设计 工 作 的 顺利 完 
成 。 同 时 ,应 用 系统 中 已 有 的 部 分 原始 基础 数据 由 于 计量 等 方面 的 因素 并 不 准确 ,因此 不 能 
够 直接 取 用 ,需要 核实 其 准确 性 ,这 项 工作 也 存在 较 大 的 困难 。 

综 上 分 析 ,数据 库 设 计 工 作 过 程 复杂 ,需要 面 对 许 多 困难 ,因此 既 要 注重 技术 开发 还 要 
注重 组 织 管理 ,才能 顺利 开展 并 完成 设计 工作 。 

2. 结构 (数据 ) 设 计 和 行为 (处 理 ) 设 计 相 结合 

数据 库 的 结构 设计 是 指数 据 库 的 模式 结构 设计 ,包括 概念 结构 设计 、 逮 辑 结构 设计 和 物 
理 存储 结构 设计 ; 行为 设计 是 指 应 用 程序 设计 ,包括 功能 结构 、 程 序 流 程控 制 等 方面 的 设 
计 。 在 传统 的 软件 工程 中 ,比较 注重 处 理 过 程 的 设计 ,不 太 注 重 数据 结构 的 设计 。 早 期 的 数 
据 库 应 用 系统 开发 过 程 中 ,常常 把 数据 库 设计 和 应 用 系统 的 设计 分 离开 来 。 随 着 数据 库 设 
计 理 论 的 成 熟 和 结构 化 分 析 与 设计 方法 的 普及 ,人 们 逐步 认识 到 数据 库 系 统 设计 的 过 程 ,应 
该 是 结构 设计 与 行为 设计 从 分 离 设计 到 相互 参照 直至 完美 统一 的 过 程 , 这 样 可 以 缩短 数据 
库 的 设计 周期 ,提高 数据 库 应 用 系统 的 设计 效率 。 

如 前 所 述 ,数据 库 系统 的 设计 包括 数据 库 设 计 和 数据 库 应 用 系统 设计 ,数据 库 是 为 应 用 
系统 服务 的 ,良好 的 数据 库 设 计 应 该 能 满足 应 用 系统 的 业务 需求 ,满足 各 种 用 户 的 需求 , 同 
时 与 应 用 系统 的 行为 设计 相 结 合 。 即 在 整个 数据 库 系 统 设计 过 程 中 要 把 数据 库 结 构 设 计 和 
对 数据 的 功能 处 理 设计 密切 结合 起 来 。 合 理 的 数据 库 系统 设计 的 基本 过 程 如 图 5-1 所 示 。 
图 中 主要 体现 数据 库 结构 设计 和 系统 功能 处 理 设计 从 分 离 设计 到 最 终结 合 的 总 体 过 程 ,省 
略 了 相互 参照 及 反复 探 询 的 迭代 过 程 细节 。 
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[数据 分 析 功能 分 析 
1 1 
[要 念 结构 设计 功能 设计 
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1 1 
[物理 结构 设计 程序 设计 
[ 数据库 实施 功能 调试 
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图 5-1 数据 库 系 统 设计 的 过 程 


5.1.2 数据 库 设计 方法 


为 了 设计 出 符合 具体 领域 要 求 的 数据 库 及 其 应 用 系统 ,多 年 来 数据 库 设计 人 员 经 过 不 
断 的 努力 和 探索 ,提出 了 各 种 数据 库 设计 方法 。 

目前 常用 的 各 种 数据 库 设计 方法 都 属于 规范 设计 法 , 即 都 是 运用 软件 工程 的 思想 与 方 
法 ,根据 数据 库 设计 特点 ,提出 各 种 设计 准则 与 设计 规范 。 其 中 的 新 奥尔良 (New Orleans) 
方法 是 目前 公认 的 比较 完整 和 权威 的 一 种 规范 设计 法 。 这 种 方法 将 数据 库 设计 分 为 四 个 阶 
段 : 需求 分 析 、 概 念 结构 设计 、 修 辑 结 构 设 计 和 物理 结构 设计 。 常 用 的 规范 设计 方法 大 多 起 
源 于 新 奥尔良 法 ,并 在 设计 的 每 一 阶段 采用 一 些 辅 助 方 法 来 具体 实现 ,如 基于 E-R 模型 的 
数据 库 设计 方法 、 基 于 3NF 的 数据 库 设计 方法 、 基 于 视图 的 数据 库 设 计 方法 等 。 规 范 设计 

计算 机 辅助 设计 法 是 指 在 数据 库 设 计 的 某 些 过 程 中 模拟 某 一 规范 化 设计 的 方法 ,并 以 
人 的 知识 或 经 验 为 主导 ,通过 人 机 交互 方式 实现 设计 中 的 某 些 部 分 。 目 前 许多 计算 机 辅助 
软件 工程 (Computer Aided Software Engineering,CASE) 工 具 已 经 实用 化 和 产品 化 ,可 以 
自动 或 辅助 设计 人 员 完 成 数据 库 设 计 过 程 中 的 很 多 任务 ,已 经 普遍 地 用 于 大 型 数据 库 设 计 
之 中 。 如 Sybase 公司 的 Power Designer 和 Oracle 公司 的 Design 2000 等 。 

除了 上 述 广泛 应 用 的 规范 设计 法 及 计算 机 辅助 设计 法 外 ,还 有 早期 的 直观 设计 法 及 最 
新 的 自动 化 设计 法 等 ,由 于 较 少 使 用 ,这 里 不 再 细 述 。 


5.1.3 数据 库 设计 的 基本 步骤 


一 般 的 应 用 系统 软件 开发 过 程 包 括 问 题 定义 、 可 行 性 研究 、 需 求 分 析 、 系 统 设计 编码 、 
测试 及 维护 等 阶段 ,对 于 需要 使 用 数据 库 的 应 用 系统 ,软件 开发 人 员 应 该 在 需求 分 析 阶 段 所 
确定 的 系统 数据 需求 的 基础 上 ,进一步 设计 数据 库 。 考 虑 数据 库 及 其 应 用 系统 开发 的 全 过 | 章 
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程 ,按照 数据 库 设计 的 规范 化 方法 ,数据 库 设 计 的 基本 步骤 可 大 致 分 为 六 个 阶段 ,如 图 5-2 
所 示 ,每 个 阶段 各 有 其 明确 的 设计 任务 。 

1. 需求 分 析 阶段 

需求 分 析 是 数据 库 设计 的 第 一 步 , 需 求 分 析 是 整个 设计 过 程 的 基础 ,需要 对 目标 系统 提 
出 完整 、 准 确 、 清 晰 .具体 的 要 求 , 是 最 困难 和 最 耗费 时 间 的 一 步 。 

数据 库 设 计 人 员 ( 系 统 分 析 员 ) 和 用 户 双方 共同 收集 与 分 析 数 据 库 所 需要 的 信息 ,准确 
了 解 用 户 对 系统 的 需求 , 弄 清 系统 要 达到 的 目标 和 实现 的 功能 ,并 以 需求 规格 说 明 书 的 形式 
确定 下 来 ,作为 以 后 系统 开发 和 验证 的 依据 。 

2. 概念 结构 设计 阶段 

概念 结构 设计 是 整个 数据 库 设 计 的 关键 。 概 念 结构 设 计 是 数据 库 设计 人 员 根 据 需 求 分 
析 阶 段 获 得 的 用 户 需 求 (包括 数据 流 图 和 数据 字典 等 ) 进 行 综合 、 归 纳 与 抽象 ,形成 反映 应 用 
系统 信息 需求 的 数据 库 概念 结构 , 即 概念 模型 。 概 念 模型 独立 于 计算 机 硬件 结构 ,独立 于 
DBMS, 

3. 逻辑 结构 设计 阶段 

他 辑 结构 设计 是 将 概念 结构 转换 为 某 个 DBMS 所 支持 的 数据 模型 ,并 依据 规范 化 理论 
对 其 进行 优化 。 

4. 物理 结构 设计 阶段 

物理 结构 设计 是 为 旭 辑 数据 模型 选取 一 个 最 适合 应 用 环境 的 物理 结构 (包括 存储 结构 
和 存 取 方 法 ) 。 

数据 库 的 物理 结构 与 具体 的 DBMS 有 关 , 数 据 库 物 理 设 计 的 任务 是 使 数据 库 的 迎 辑 结 
构 在 物理 设备 上 得 以 实现 ,建立 一 个 性 能 优良 的 数据 库 物 理 结构 。 

5. 数据 库 实施 阶段 

数据 库 实施 阶段 是 设计 人 员 运 用 指定 的 DBMS 提供 的 数据 库 操 作 语言 及 其 宿主 语言 ， 
根据 逻辑 设计 和 物理 设计 的 结果 建立 数据 库 结构 ,编写 与 调试 应 用 程序 ,组 织 数据 人 库 并 实 

6. 数据 库 运 行 和 维护 阶段 

数据 库 应 用 系统 经 过 试 运行 结果 符合 设计 目标 后 ,数据库 即 可 正式 投入 运行 了 。 数 据 
库 投入 运行 标志 着 开发 任务 的 基本 完成 和 维护 工作 的 开始 ,并 不 意味 着 设计 过 程 终 结 。 由 
于 应 用 环境 在 不 断 变 化 ,数据 库 运行 过 程 中 物理 存储 也 会 不 断 变化 ,因此 在 数据 库 系统 运行 
过 程 中 ,需要 不 断 地 对 数据 库 结构 性 能 进行 评价 、 调 整 和 修改 。 

综 上 所 述 ,数据 库 设 计 中 的 前 两 个 阶段 需求 分 析 和 概念 结构 设计 是 面向 用 户 的 应 用 要 
求 ,面向 具体 的 问题 ,可 以 独立 于 任何 DBMS; 中 间 两 个 阶段 逻辑 结构 设计 和 物理 结构 设计 
是 面向 DBMS ,与 选用 的 DBMS 密切 相关 ; 最 后 两 个 阶段 是 面向 具体 的 实现 方法 。 

从 图 5-2 可 以 看 出 ,数据 库 设 计 是 分 阶段 完成 的 ,每 完成 一 个 阶段 ,都 要 进行 设计 分 析 ， 
评价 一 些 重要 的 设计 指标 ,把 设计 阶段 产生 的 文档 组 织 评审 ,与 用 户 进行 交流 。 如 果 设 计 的 
数据 库 不 符合 要 求 则 进行 修改 ,这 种 分 析 和 修改 可 能 要 重复 若干 次 ,设计 一 个 完善 的 数据 库 
应 用 系统 往往 是 六 个 阶段 不 断 重复 的 过 程 。 

在 数据 库 设 计 过 程 中 ,只 有 认真 对 待 每 个 具体 实施 细节 ,才能 设计 出 性 能 良好 的 数据 
库 , 因 此 特别 指出 以 下 几 点 。 
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图 5-2 ”数据库 设 计 的 步骤 


(1) 数据 库 设计 开始 之 前 ,首先 必须 选 定 参加 设计 的 人 员 ,包括 系统 分 析 人 员 ,数据 库 
设计 人 员 、 应 用 开发 人 员 数据库 管理 员 和 用 户 代表 。 系 统 分 析 和 数据 库 设计 人 员 是 数据 库 
设计 的 核心 人 员 ,应 自始至终 参与 数据 库 设 计 , 其 对 数据 库 系统 的 质量 保证 起 到 至 关 重 要 的 
作用 ; 用 户 和 数据 库 管理 员 在 数据 库 设计 中 的 作用 也 是 举足轻重 的 ,主要 参加 需求 分 析 及 
数据 库 的 运行 和 维护 ,其 积极 参与 (不 仅仅 是 配合 ) 不 但 能 加 速 数 据 库 设 计 , 而 且 也 是 决定 数 
据 库 设计 质量 的 重要 因素 ; 应 用 开发 人 员 ( 包 括 程序 员 和 操作 员 ) 分 别 负 责编 制程 序 和 准备 
软 硬 件 环境 ,他 们 在 系统 实施 阶段 参与 进来 。 

(2) 如 果 所 设计 的 数据 库 应 用 系统 比较 复杂 ,还 应 该 考虑 是 否 需要 使 用 数据 库 设 计 工 
有 具 以 及 选用 何 种 工具 ,以 提高 数据 库 设 计 质 量 并 减少 设计 工作 量 。 

(3) 图 5-2 所 示 的 设计 步骤 既是 数据 库 设 计 的 过 程 , 也 包括 了 数据 库 应 用 系统 的 设计 
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过 程 。 在 设计 过 程 中 ,把 数据 库 的 设计 和 对 数据 库 中 数据 处 理 的 设计 紧密 结合 起 来 ,将 这 两 
个 方面 的 需求 分 析 抽象. 设计 、 实 现在 各 个 阶段 同时 进行 ,相互 参照 ,相互 补充 ,以 完善 两 方 
面 的 设计 。 事 实 上 ,如 果 不 了 解 应 用 环境 对 数据 的 处 理 要求 , 或 没有 考虑 如 何 去 实现 这 些 处 
理 要 求 , 是 不 可 能 设计 一 个 良好 的 数据 库 结 构 的 。 表 5-1 概括 地 给 出 了 设计 过 程 各 个 阶段 
关于 数据 特性 的 设计 描述 。 有 关 处 理 特性 的 设计 描述 ,包括 设计 原理 、 采 用 的 设计 方法 及 工 
具 等 ,在 软件 工程 和 信息 系统 设计 的 课程 中 有 详细 介绍 ,这 里 不 再 讨论 。 


表 5-1 数据 库 设计 各 个 阶段 数据 特性 的 设计 描述 


设计 阶段 设计 描述 
需求 分 析 数据 字典 、 系 统 中 数据 项 ,数据 流 ,数据 存储 的 描述 
概念 结构 设计 概念 模型 (E-R 图 ) .数据 字典 (完善 
逻辑 结构 设计 数据 模型 (关系 或 非 关系 数据 模型 ) 
物理 结构 设计 存储 安排 、 存 取 方 法 的 选择 、 存 取 路 径 的 建立 
数据 库 实 施 创建 数据 库 模式 .加载 数据 ,数据库 试 运行 
数据 库 运 行 与 维护 数据 库 性 能 监测 ,数据库 转 储 与 恢复 \ 数 据 库 重组 与 重 构 


以 下 将 结合 高 校 教学 信息 管理 系统 的 数据 库 设 计 过 程 ,探讨 如 何 完成 数据 库 设计 各 个 
阶段 的 任务 。 


5.2 需求 分 析 


为 了 开发 出 真正 满足 用 户 需 求 的 软件 产品 ,数据 库 设 计 首先 必须 了 解 用 户 的 需求 。 需 
求 分 析 是 设计 数据 库 的 起 点 ,对 用 户 需 求 的 深入 理解 是 数据 库 设计 获得 成 功 的 前 提 条 件 ,不 
能 真正 满足 用 户 需求 的 设计 只 会 令 用 户 失 望 , 可 能 会 导致 整个 数据 库 设计 返工 重 做 。 


S.2.1 需求 分 析 的 任务 


需求 分 析 的 任务 不 是 确定 系统 怎样 完成 它 的 工作 ,而 仅仅 是 确定 系统 必须 完成 哪些 工 
作 , 通 过 详细 的 用 户 调查 ,充分 了 解 原 系 统 ( 手 工 系统 或 计算 机 系统 ) 的 工作 现状 ,对 目标 系 
统 提 出 完整 ,准确 、 清 晰 、 具 体 的 要 求 . 最 终 形成 系统 需求 分 析 报 告 , 即 软件 需求 规格 说 明 书 。 

用 户 调查 的 重点 是 “数据 "需求 和 围绕 这 些 数 据 的 业务 处理” 需求。 通过 调查 要 从 用 户 
那里 获得 对 数据 库 系 统 的 下 列 要 求 。 

(1) 信息 需求 。 定 义 数据 库 应 用 系统 用 到 的 所 有 信息 ,明确 用 户 将 向 数据 库 中 输入 什 
么 样 的 数据 ,从 数据 库 中 要 求 获得 哪些 内 容 , 将 要 输出 哪些 信息 。 也 就 是 明确 在 数据 库 中 需 
要 存储 哪些 数据 ,对 这 些 数据 做 哪些 处 理 等 ,同时 还 要 描述 数据 间 的 联系 等 。 

(2) 处 理 需求 。 定 义 系统 数据 处 理 的 操作 功能 ,描述 操作 的 优先 次 序 , 包 括 操作 的 执行 
频率 和 场合 ,操作 与 数据 间 的 联系 ; 还 要 明确 用 户 要 完成 哪些 处 理 功 能 ,每 种 处 理 的 执行 频 
度 ,用户 需求 的 响应 时 间 以 及 处 理 方式 (比如 是 联机 处 理 还 是 批 处 理 ) 等 等 。 

(3) 安全 性 与 完整 性 要 求 。 安 全 性 要 求 描述 系统 中 不 同 用 户 对 数据 库 的 使 用 和 操作 情 
况 , 完 整 性 要 求 描述 数 据 之 间 的 关联 关系 以 及 数据 的 取 值 范 围 要 求 。 

(4) 将 来 可 能 提出 的 要 求 。 应 该 明确 地 列 出 那些 虽然 不 属于 当前 系统 开发 范畴 ,但 是 


依据 分 析 将 来 很 可 能 会 提出 来 的 要 求 。 这 样 做 的 目的 是 ,在 设计 过 程 中 对 系统 将 来 可 能 的 
扩充 和 修改 做 准备 ,以 便 一 旦 确实 需要 时 能 比较 容易 地 进行 这 种 扩充 和 修改 。 

在 充分 了 解 上 述 各 项 需求 的 基础 上 ,系统 分 析 员 应 该 以 书面 形式 准确 地 描述 系统 的 各 
项 需求 ,最 终 形成 系统 需求 分 析 报 告 即 软件 需求 规格 说 明 书 。 其 中 描述 系统 数据 特性 的 数 
据 字 典 ,是 下 一 步 进 行 概念 结构 设计 的 基础 。 

在 分 析 软 件 需求 和 书写 软件 需求 规格 说 明 书 的 过 程 中 ,分 析 员 和 用 户 都 起 着 关键 的 \ 必 
不 可 少 的 作用 。 只 有 用 户 才 真 正 知 道 自己 需要 什么 ,但 是 他 们 并 不 知道 怎样 用 软件 实现 自 
己 的 需求 ,用 户 必须 把 他 们 对 软件 的 需求 尽量 准确 .具体 地 描述 出 来 ; 分 析 员 知道 怎样 用 软 
件 实现 人 们 的 需求 ,但 是 在 需求 分 析 开 始 时 他 们 对 用 户 的 需求 并 不 十 分 清楚 ,必须 通过 与 用 
户 沟通 获取 用 户 对 软件 的 需求 。 需 求 分 析 和 规格 说 明 是 一 项 十 分 艰巨 复杂 的 工作 。 用 户 与 
分 析 员 之 间 需 要 沟通 的 内 容 非 常 多 ,在 双方 交流 信息 的 过 程 中 很 容易 出 现 误解 或 遗漏 ,也 可 
能 存在 二 义 性 。 因 此 ,不 仅 在 整个 需求 分 析 过 程 中 应 采用 行 之 有 效 的 通信 技术 ,集中 精力 细 
致 工作 ,而 且 必 须 严格 审查 验证 需求 分 析 的 结果 。 


5.2.2 需求 分 析 的 工具 


需求 规格 说 明 书 是 需求 分 析 阶 段 获得 的 最 主要 的 文档 ,其 中 对 于 处 理 需 求 及 数据 需求 
的 主要 描述 工具 是 数据 流 图 (Data Flow Diagram,DFD) 和 数据 字典 (Data Dictionary,DD) 。 

1. 数据 流 图 

数据 流 图 是 从 “数据 "和 “对 数据 的 加 工 ” 两 方面 表达 数据 处 理 过 程 的 一 种 图 形 表示 法 ， 
具有 直观 .易于 被 用 户 和 软件 人 员 双 方 都 能 理解 的 一 种 表达 系统 逻辑 功能 的 描述 方式 。 

数据 流 图 包括 数据 流 、 加 工 、 数 据 存储 、 数 据 的 源 点 和 终点 共 四 部 分 ,每 部 分 都 有 相应 的 
图 形 符号 。 

(1) 数据 流 

数据 流 表示 流动 的 数据 ,数据 流 可 以 是 一 项 数据 ,也 可 以 是 一 组 数据 ,也 可 以 表示 对 数 
据 文 件 的 存储 信息 。 通 常用 带 箭 头 的 直线 表示 数据 流 , 在 箭头 上 方 标明 数据 流 的 名 称 。 

《2》 加 工 

加 工 也 称 数据 处 理 。 通 常用 一 个 圆 表 示 数 据 处 理 逻 辑 , 圆 的 内 部 标明 处 理 迎 辑 的 名 称 。 

(3) 数据 存储 

数据 存储 表示 数据 的 静态 存储 ,可 以 代表 数据 文件 或 文件 的 一 部 分 。 一 般 用 两 条 平行 
横 线 来 表示 , 横 线 上 方 或 旁边 注 明 文件 的 名 称 或 内 容 。 

(4) 数据 源 点 和 终点 

数据 源 点 和 终点 表示 数据 流动 的 开始 和 结束 ,通常 用 方 框 表示 , 方 框 的 内 部 标明 数据 源 

数据 流 图 的 每 个 部 分 都 要 命名 以 便 区 分 .图 5-3 是 一 个 简单 的 数据 流 图 。 其 含义 是 数 
据 流 Dl 从 始点 S 流出 ,经 过 Pl 加 工 处 理 变 成 数据 流 2 
D2.PL 加 工时 要 调用 文件 FL 中 的 内 容 , 数 据 流 D2 再 经 5 仿 2 [:] 
过 P2 加 工 处 理 , 加 工 处 理 时 要 把 部 分 结果 存放 到 文件 Fl 2 
F2 中 ,同时 产生 数据 流 D3, 数 据 流 D3 流 往 终 点 EE。 5-3 数据 流 图 示例 
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2. 数据 字典 
数据 流 图 主要 描述 数据 在 系统 内 变换 处 理 的 过 程 ,但 并 没有 具体 说 明 相 关 的 数据 及 处 
理 的 含义 。 只 有 在 对 每 个 组 成 成 分 进行 确切 的 定义 后 ,才能 完整 地 描述 系统 的 功能 。 因 此 
数据 库 设计 人 员 必 须 对 数据 流 图 中 的 每 个 数据 流 .数据 存储 加 工 都 给 出 具体 定义 并 分 别 描 
述 出 来 ,描述 后 形成 的 文档 称 为 “数据 字典 ”。 
数据 字典 是 对 系统 中 数据 的 详细 描述 ,在 需求 分 析 阶 段 ,数据 字典 是 对 数据 流 图 中 的 有 
关 成 分 数据 流 、 加 工 和 数据 存储 进行 描述 的 产物 ,也 就 是 对 数据 流 图 中 包含 的 所 有 元 素 的 定 
义 的 集合 。 数 据 字典 中 每 个 数据 条 目的 定义 内 容 集中 描述 在 一 个 表 中 ,因此 ,数据 字典 实际 
上 是 定义 数据 的 表 的 集合 。 数 据 字 典 的 建立 ,使 数据 库 系统 中 的 数据 、 加 工 和 文件 都 有 统一 
的 名 称 、 格 式 和 含义 ,从 而 实现 数据 的 标准 化 和 统一 化 。 数 据 字典 的 建立 与 完善 贯穿 于 需求 
分 析 到 数据 库 运 行 的 全 过 程 ,在 不 同 的 阶段 其 内 容 被 不 断 修改 及 完善 。 
数据 字典 通常 包括 数据 项 ,数据 结构 ,数据 流 、 数 据 存 储 和 处 理 过 程 几 部 分 内 容 。 其 中 
数据 项 是 数据 的 最 小 组 成 单位 ,若干 个 数据 项 可 以 组 成 一 个 数据 结构 。 
(1) 数据 项 
数据 项 也 称 为 数据 元 素 ,是 数据 的 最 小 单位 。 其 具体 内 容 描 述 为 : 
数据 项 = {数据 项 名 ,含义 说 明 , 别 名 ,类 型 ,长 度 , 取 值 范围 ,与 其 他 数据 项 的 关系 } 
其 中 ,“ 取 值 范 围 ”与 “其 位 数据 项 的 关系 ”这 两 项 内 容 定 义 了 完整 性 约束 条 件 , 是 设计 数据 检 
验 功能 的 依据 。 
(2) 数据 结构 
数据 结构 的 描述 为 : 
数据 结构 三 {数据 结构 名 ,含义 说 明 , 组 成 : {数据 项 或 数据 结构 )} 
数据 结构 反映 数据 之 间 的 组 合 关系 ,一 个 数据 结构 可 以 由 若干 个 数据 项 组 成 ,也 可 以 由 若干 
个 数据 结构 组 成 ,或 若干 个 数据 项 和 数据 结构 组 合 而 成 。 
(3) 数据 流 
数据 流 表示 某 一 处 理 过 程 中 数据 在 系统 内 传输 的 路 径 。 每 个 数据 流 可 以 是 数据 项 ,也 
可 以 是 数据 结构 。 数 据 流 的 描述 为 : 
数据 流 二 {数据 流 名 ,说 明 , 流 出 过 程 ,流入 过 程 ， 
组 成 : {数据 项 或 数据 结构 } ,平均 流量 ,高 峰 期 流量 } 
其 中 ,“ 流 出 过 程 ”说 明 该 数据 流 由 哪个 过 程 而 来 ;“ 流 入 过 程 ” 说 明 该 数据 流 到 哪个 过 程 ; 
“流量 ”是 指 传输 次 数 。 
(4) 数据 存储 
数据 存储 是 处 理 过 程 中 数据 及 其 结构 的 存放 场所 ,也 是 数据 流 的 来 源 和 去 向 之 一 。 数 
据 存储 可 以 是 手工 凭证 .手工 文档 或 计算 机 文档 。 数 据 存储 的 描述 为 : 
数据 存储 = 《数据 存储 名 ,说明 ,编号 ,输入 的 数据 流 .输出 的 数据 流 ， 
组 成 : {数据 结构 ) ,数据 , 存 取 频 度 , 存 取 方式 } 
其 中 ,“ 存 取 频 度 ” 是 指 每 天 (或 每 小 时 或 每 周 ) 存 取 次 数 、 每 次 存 取 多 少数 据 等 信息 ;“ 存 取 
方式 ?是 指 批 处 理 还 是 联机 处 理 , 是 检索 还 是 更 新 ,是 顺序 检索 还 是 随机 检索 等 ;“ 输 入 的 数 
据 流 ?是 指数 据 的 来 源 ;“ 输 出 的 数据 流 ? 是 指数 据 的 去 向 。 


(5) 处 理 过 程 

对 数据 处 理 的 定义 用 其 他 工具 描述 更 方便 ,处 理 过 程 的 处 理 逻 辑 通 常用 判定 表 或 判定 
树 来 描述 ,数据 字典 中 仅 描述 处 理 过 程 的 说 明 性 信息 。 

处 理 过 程 包括 二 {处 理 过 程 名 ,说 明 , 输 入; {数据 流 } ,输出 : 
{数据 流 } ,处 理 : {简要 说 明 )} 

其 中 ,“ 简 要 说 明 ” 主 要 说 明 该 处 理 过 程 的 功能 和 处 理 的 要 求 , 即 说 明 该 处 理 过 程 用 来 做 什么 
及 人 处理 频 度 要 求 。 

(6) 数据 定义 

数据 字典 中 数据 的 定义 就 是 对 数据 自 顶 向 下 的 分 解 。 那 么 ,应 该 把 数据 分 解 到 什么 程 
度 呢 ? 一 般 说 来 , 当 分 解 到 不 需要 进一步 定义 ,每 个 和 工程 有 关 的 人 也 都 清楚 其 含义 的 时 
候 , 分 解 过 程 就 完成 了 。 

由 数据 元 素 组 成 数据 的 方式 只 有 下 述 4 种 基本 类 型 : 

Oa 顺序 , 即 以 确定 的 次 序 连接 两 个 或 多 个 分 量 ; 

@ 选择 , 即 从 两 个 或 多 个 可 能 的 元 素 中 选取 一 个 ; 

@ 重复 , 即 把 指定 的 分 量 重复 零 次 或 多 次 ; 

@ 可 选 , 即 一 个 分 量 是 可 有 可 无 的 (重复 零 次 或 一 次 ) 。 

虽然 使 用 自然 语言 可 以 描述 由 数据 元 素 组 成 数据 的 关系 ,但 为 了 更 加 清晰 简洁 ,人 们 为 
上 述 几 种 组 成 数据 的 方式 赋予 了 简单 的 符号 ,如 表 5-2 所 示 。 


表 5-2 数据 字典 定义 式 中 使 用 的 符号 


符号 含义 解 释 

加 等 价 于 定义 为 

未 与 ,连接 符 连接 左右 两 个 分 量 

[ ] 或 ,选择 符 对 方 括号 中 列举 的 分 量 任 选 其 一 

f 重复 符 重复 花 括 号 内 的 分 量 ,重复 次 数 上 下 限 可 在 左右 两 侧 标明 
( ) 可 选 符 圆 括号 内 的 分 量 可 有 可 无 


5.2.3 需求 分 析 的 方法 


依据 需求 分 析 的 任务 ,需求 分 析 阶 段 的 工作 主要 分 为 两 部 分 : 第 一 部 分 是 设计 人 员 和 与 
用 户 共 同 协作 ,调查 清楚 用 户 的 实际 要 求 ; 第 二 部 分 是 分 析 与 表达 这 些 需 求 并 形成 需求 分 
析 报 告 , 即 需求 规格 说 明 书 。 经 过 多 年 的 探索 ,调查 及 分 析 用 户 的 需求 都 形成 了 相应 的 流程 
及 方法 。 

1. 调查 用 户 需 求 的 具体 方法 

调查 用 户 需求 是 通过 调查 从 用 户 那里 获得 对 数据 库 系 统 的 信息 需求 .处理 需 求 . 安 全 性 
与 完整 性 要 求 及 将 来 可 能 提出 的 要 求 。 在 调查 过 程 中 ,可 以 根据 不 同 的 问题 和 条 件 使 用 不 
同 的 调查 方法 。 常 用 的 调查 方法 有 如 下 几 中 。 

(1) 跟班 作业 。 通 过 亲身 参加 业务 工作 来 了 解 业 务 活 动 的 情况 。 

(2) 开 调 查 会 。 通 过 与 用 户 座谈 来 了 解 业务 活动 情况 及 用 户 需求 。 
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(3) 请 专人 介绍 。 

(4) 询问 。 对 某 些 调查 中 的 问题 可 以 找 专人 询问 。 

(5) 设计 调查 表 请 用 户 填写 。 如 果 调 查 表 设计 合理 ,这 种 方法 是 很 有 效 的 。 

(6) 查阅 记录 。 查 阅 与 原 系统 有 关 的 数据 记录 。 

实际 调查 时 往往 需要 同时 采用 上 述 多 种 方法 才能 完成 需求 分 析 的 任务 。 

2. 分 析 和 表达 用 户 需 求 的 方法 

用 户 调查 了 解 用 户 需求 以 后 ,还 需要 进一步 分 析 和 表达 用 户 的 需求 。 在 众多 分 析 方 法 
中 结构 化 分 析 (Structured Analysis,SA) 方 法 是 一 种 简单 实用 的 方法 。SA 方法 从 最 上 层 的 
系统 组 织 机 构 入 手 , 采 用 自 项 向 下 逐 层 分 解 的 方式 分 析 系 统 。 

结构 化 分 析 方 法 就 是 面向 数据 流 自 项 向 下 逐步 求 精进 行 需求 分 析 的 方法 。 最 终 的 需求 
分 析 报 告 要 把 DFD 中 的 数据 流 和 数据 存储 在 数据 字典 中 定义 到 元 素 级 。 为 了 达到 这 个 目 
标 ,通常 从 数据 流 图 的 输出 端 着 手 分 析 , 这 是 因为 系统 的 基本 功能 是 产生 这 些 输出 ,输出 数 
据 决定 了 系统 必须 具有 的 最 基本 的 组 成 元 素 。 

输出 数据 是 由 哪些 元 素 组 成 的 呢 ? 通 过 调查 访问 不 难 弄 清 这 个 问题 。 沿 数据 流 图 从 输 
出 端 往 输入 端 回溯 ,应 该 能 够 确定 每 个 数据 元 素 的 来 源 ,与 此 同时 也 就 初步 定义 了 有 关 的 算 
法 。 沿 数据 流 图 回溯 时 常常 遇 到 下 述 问题 : 为 了 得 到 某 个 数据 元 素 需 要 用 到 数据 流 图 中 目 
前 还 没有 的 数据 元 素 ,或 者 得 出 这 个 数据 元 素 需 要 用 的 算法 尚 不 完全 清楚 。 为 了 解决 这 些 
问题 ,往往 需要 向 用 户 和 其 他 有 关 人 员 请 教 ,他 们 的 回答 使 分 析 员 对 目标 系统 的 认识 更 深 
入 、 更 具体 了 ,系统 中 更 多 的 数据 元 素 被 划分 出 来 了 ,更 多 的 算法 被 弄 清楚 了 。 通 常 把 分 析 
过 程 中 得 到 的 有 关 数 据 元 素 的 信息 记录 在 数据 字典 中 ,把 对 算法 的 简明 描述 记录 在 IPO 图 
(描述 处 理 过 程 的 图 形 工具 ) 中 。 通 过 分 析 而 补充 的 数据 流 、 数 据 存储 和 人 处理, 应 该 添加 到 数 
据 流 图 的 适当 位 置 上 。 

必须 请 用 户 对 上 述 分 析 过 程 得 出 的 结果 仔细 地 复查 ,数据 流 图 是 帮助 复查 的 极 好 工具 。 
从 输入 端 开始 ,分 析 员 借助 数据 流 图 、 数 据 字 典 和 IP0 图 向 用 户 解释 输入 数据 是 怎样 一 步 一 
步 地 转变 成 输出 数据 的 。 这 些 解释 集中 反映 了 通过 前 面 的 分 析 员 所 获得 的 对 目标 系统 的 认 
识 。 用 户 应 该 注意 倾听 分 析 员 的 报告 ,并 及 时 纠正 和 补充 分 析 员 的 认识 。 复 查 过 程 验 证 了 
已 知 的 元 素 , 补 充 了 未 知 的 元 素 , 填 补 了 文档 中 的 空白 。 

反复 进行 上 述 分 析 过 程 ,分 析 员 越 来 越 深 入 地 定义 了 系统 中 的 数据 和 系统 应 该 完成 的 
功能 。 为 了 追踪 更 详细 的 数据 流 , 分 析 员 应 该 把 数据 流 图 扩展 到 更 低 的 层次 。 通 过 功能 分 
解 可 以 完成 数据 流 图 的 细 化 。 对 数据 流 图 细 化 之 后 得 到 一 组 新 的 数据 流 图 ,不 同 的 系统 元 
素 之 间 的 关系 变 得 更 清楚 了 。 对 这 组 新 数据 流 图 的 分 析 追 踪 可 能 产生 新 的 问题 ,这 些 问题 
的 答案 可 能 又 在 数据 字典 中 增加 一 些 新 条 目 , 并 且 可 能 导致 新 的 或 精 化 的 算法 描述 。 随 着 
分 析 过 程 的 进行 ,经 过 提问 和 解答 的 反复 循环 ,分 析 员 越 来 越 深 入 具体 地 定义 了 目标 系统 ， 
最 终 得 到 对 系统 数据 和 功能 要 求 的 满意 描述 。 

对 用 户 需求 进行 分 析 之 后 ,系统 分 析 员 汇总 用 户 对 系统 的 各 项 需求 .数据 流 图 及 数据 字 
典 等 ,形成 需求 规格 说 明 书 。 需 求 规格 说 明 书 必须 提交 给 用 户 , 征 得 用 户 的 最 终 认可 。 

3. 需求 分 析 工 作 的 具体 步 又 

对 于 一 个 数据 库 应 用 系统 ,需求 分 析 工 作 的 具体 步骤 如 下 。 


(1) 调查 分 析 应 用 系统 的 现状 ,产生 业务 流程 图 。 

了 解 组 织 机 构 情 况 : 应 用 系统 的 部 门 组 成 情况 、 各 部 门 的 职责 等 ; 调查 各 部 门 的 业务 
活动 情况 : 包括 了 解 各 部 门 输入 和 使 用 什么 数据 ,如 何 加 工 处理 这 些 数据 ,输出 什么 信息 ， 
输出 到 什么 部 门 , 输 出 结果 的 格式 是 什么 等 。 

(2) 确定 系统 范围 ,产生 系统 关联 图 。 

(3) 分 析 用 户 活动 所 涉及 的 数据 ,产生 数据 流 图 ,确定 新 系统 的 边界 。 

在 熟悉 业务 活动 的 基础 上 ,协助 用 户 明 确 对 新 系统 的 各 种 要 求 ,包括 信息 要 求 、 处 理 要 
求 、 安 全 性 与 完整 性 要 求 及 未 来 可 能 的 要 求 。 

(4) 分 析 系 统 数据 产生 数据 字典 

数据 库 设计 人 员 必 须 对 数据 流 图 中 的 每 个 数据 流 、 数 据 存储 ` 加 工 都 要 给 出 具体 定义 ， 
日 相应 的 条 目 来 描述 , 即 形成 数据 字典 。 

(5) 形成 系统 需求 规格 说 明 书 

下 面 通过 一 个 简单 的 高 校 教学 信息 管理 系统 需求 分 析 的 实例 ,进一步 理解 需求 分 析 阶 
段 的 工作 步骤 及 分 析 方 法 。 

【 例 1】 高 校 教学 信息 管理 系统 主要 分 为 教师 授课 聘 课 与 学 生 选 课 两 个 部 分 , 试 完成 
对 该 系统 的 需求 分 析 。 

解 : 依据 上 述 需 求 分 析 的 步骤 ,高 校 教学 管理 信息 系统 需求 分 析 的 具体 过 程 : 

(1) 分 析 用 户 活动 ,产生 业务 流程 图 

如 果 系 统 比较 复杂 ,可 以 从 了 解 用 户 日 常 工作 流程 人 手 , 通 过 座谈 会 .与 职员 共同 工作 ， 
设计 调查 问卷 查阅 历史 业务 记录 等 途径 来 搞 清 业务 的 处 理 过 程 。 

图 5-4 是 该 学 校 的 教学 活动 业务 流程 图 。 

(2) 确定 系统 范围 ,产生 系统 关联 图 

分 析 业 务 流程 ,与 用 户 充分 协商 确定 系统 范围 : 

| 这 一 步 确定 系统 的 边界 , 即 确定 用 计算 机 处 理 的 范围 。 

@ 在 与 用 户 充分 协商 的 基础 上 ,确定 计算 机 所 能 进行 的 数据 处 理 的 范围 ,确定 哪些 工 
作 由 人 工 完成 ,哪些 工作 由 计算 机 系统 完成 , 即 确定 人 机 界面 。 

@ 图 5.4 中 虚线 框 内 的 部 分 属于 计算 机 系统 范围 ,而 框 外 部 分 由 人 工 处 理 。 


间 


授课 一 +e=| 授课 申请 =| 聘 课 =| 打印 聘书 =| 交 给 老师 


选课 一 | 选课 申请 = 选课 =| 打印 课程 表 一 + 一 | 交 给 学 生 


图 5-4 学校 的 教学 活动 业务 流程 图 


(3) 分 析 用 户 业务 活动 涉及 的 数据 ,产生 数据 流 图 

生成 数据 流 图 需要 从 初始 数据 流 图 开始 逐 层 分 解 完 成 。 

中 生成 初始 数据 流 图 

深入 分 析 用 户 的 业务 处 理 流程 ,以 数据 流 图 形式 表示 出 数据 的 流向 和 对 数据 所 进行 的 
加 工 。 高 校 教学 管理 系统 的 初始 数据 流 图 如 图 5-5 所 示 。 

教师 提出 授课 请 求 , 经 教学 信息 管理 系统 处 理 后 ,形成 教学 任务 书 即 聘书 交 给 教师 。 
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教师 


图 5-5 学校 教 学 管理 初始 数据 流 图 


学 生 提出 选课 请 求 后 ,经 教学 信息 管理 系统 处 理 后 ,形成 课程 表 交 给 学 生 。 

@ 逐步 细 化 

在 图 5-5 基础 上 细 化 的 系统 数据 流 图 分 为 聘 课 与 选课 两 部 分 ,分 别 如 图 5-6 及 图 5-7 所 
示 , 两 个 图 中 都 省 略 了 数据 的 源 点 和 终点 (分 别 为 “教师 ”和 “学 生 ”)。 


授课 请 求 授课 信息 聘书 
教师 基本 信息 


图 5-6 聘 课 数据 流 图 


mitt (a ) 选课 信息 -rm ) ee 
学 生 基 本 信息 


图 5-7 选课 数据 流 图 


当 教师 提出 授课 请 求 后 ,系统 进行 聘 课 处 理 时 需要 使 用 教师 基本 信息 ,然后 产生 授课 信 
息 ,经 打印 处 理 后 形成 授课 任务 书 , 即 聘书 。 
当 学 生 提出 选课 请 求 后 ,系统 进行 选课 处 理 时 需要 使 用 学 生 基本 信息 ,然后 产生 选课 信 
息 , 经 打印 处 理 后 形成 课程 表 。 
(4) 分 析 系 统 数据 ,产生 数据 字典 
数据 库 设计 人 员 必 须 对 数据 流 图 中 的 每 个 数据 流 、 数 据 存储 、 加 工 都 要 给 出 具体 定义 ， 
并 用 相应 的 条 目 来 描述 , 即 形成 数据 字典 。 具 体 项 目 开 发 过 程 中 ,各 类 数据 字典 条 目的 定义 
应 按照 5. 2. 2 节 所 述 描述 ,每 个 条 目 完整 的 描述 应 该 是 一 个 表 , 表 中 包含 全 部 需要 描述 的 内 
容 。 以 下 给 出 的 描述 是 各 类 数据 主要 组 成 部 分 的 描述 。 
O@ 数据 流 的 组 成 描述 
定义 数据 流 的 组 成 ,每 个 数据 流通 常 包 括 若干 个 数据 项 。 下 面 是 对 图 5-6 中 的 儿 个 数 
据 流 的 描述 : 
授课 请 求 = 教师 号 十 教师 姓名 十 课程 号 十 课程 名 称 十 总 学 时 十 班级 名 称 
聘书 = 教师 姓名 十 课程 名 称 十 班级 名 称 十 上 课时 间 十 上 课 地 点 
@ 数据 存储 的 组 成 描述 
教师 基本 信息 = 教师 编号 十 教师 姓名 十 性 别 十 出 生年 月 十 单位 名 称 
@ 数据 项 的 描述 
对 数据 项 进行 定义 ,主要 包括 对 数据 项 的 名 称 、 类 型 .长度 、 取 值 范围 等 进行 定义 。 如 对 


“学 生 基 本 信息 ”文件 中 的 数据 项 ,可 按 表 5-3 进行 描述 。 
表 5-3 学 生 基本 信息 数据 项 的 描述 


数据 项 名 类 型 长 度 ( 字 节 ) 取 值 范围 
学 号 字符 10 
姓名 字符 10 
性 别 字符 2 “ 男 ” 或 “ 女 ” 
年 龄 正 整 数 4 15~35 
学 院 名 称 字符 20 


数据 项 的 组 成 ,如 : 学 号 ==10{ 数 字 }10; 性 别 =[ 男 / 女 ]。 

@ 加 工 的 描述 

对 数据 处 理 的 处 理 逻 辑 通常 用 判定 表 或 判定 树 来 描述 ,数据 字典 中 仅 描述 处 理 过 程 的 
说 明 性 信息 ,包括 过 程 名 .过 程 说 明 、 输 入 输出 和 过 程 功能 说 明 等 。 如 对 “学 生 选 课 ” 处 理 过 
程 描述 如 下 : 

过 程 名 称 : 选课 。 

过 程 说 明 : 主要 说 明 该 处 理 过 程 的 功能 及 处 理 要 求 。 例 如 : 学 生根 据 自己 的 需要 

输入 : 执行 该 处 理 过 程 需要 输入 的 数据 。 例 如 “选课 请 求 " 和 “学 生 基 本 信息 ”。 

输出 : 执行 该 处 理 过 程 后 输出 的 数据 。 例 如 “课程 表 ”。 

经 过 上 述 四 个 步骤 ,需求 分 析 阶 段 的 工作 已 基本 完成 ,已 经 得 到 了 “数据 流 图 "和 “数据 
字典 ”。 汇 总 数据 流 图 、 数 据 字 典 、 加 工 说 明 及 相应 的 各 项 需求 说 明 , 即 可 形成 系统 需求 规格 
说 明 书 。 至 此 ,基本 上 明确 了 系统 需要 “做 什么 ”的 问题 ,下 一 阶段 将 开始 解决 系统 “怎样 做 ” 
的 问题 。 


5.3 概念 结构 设计 


需求 分 析 阶 段 描述 的 用 户 需求 是 面向 现实 世界 的 具体 需求 ,将 需求 分 析 得 到 的 用 户 需 
求 抽象 为 信息 结构 即 概念 模型 的 过 程 是 概念 结构 设计 。 

概念 模型 独立 于 计算 机 的 硬件 ,独立 于 支持 数据 库 的 DBMS。 设 计 概念 模型 的 目的 是 
向 某 种 DBMS 支持 的 数据 模型 转换 ,最终 用 DBMS 实现 用 户 需 求 。 因 此 ,概念 模型 是 数据 
库 逻 辑 设计 的 依据 ,概念 结构 设计 是 整个 数据 库 设计 的 关键 步骤 。 

数据 库 应 用 系统 中 通常 采用 E-R 图 来 描述 现实 世界 的 概念 模型 ,用 E-R 图 描述 的 概念 
模型 也 称 为 E-R 模型 ,有 关 E-R 模型 的 基本 概念 ,本 书 第 1 章 已 有 介绍 。 本 节 介 绍 概念 模 
型 的 特点 、 概 念 结构 设计 的 方法 及 步骤 。 


5.3.1 概念 模型 的 特点 


在 需求 分 析 阶 段 ,设计 人 员 充 分 调查 并 描述 了 用 户 的 需求 ,概念 结构 设计 阶段 要 将 这 些 
用 户 需求 抽象 为 信息 世界 的 结构 即 概念 模型 。 概 念 模型 应 具备 的 主要 特点 如 下 。 

(1) 具有 丰富 的 语义 表达 能 力 

概念 模型 应 能 够 表达 用 户 的 各 种 需求 ,充分 反映 现实 世界 ,包括 描述 事物 与 事物 之 间 的 
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联系 ,能 满足 用 户 对 数据 的 处 理 需 求 。 

(2) 易于 交流 和 理解 。 

概念 模型 的 表达 应 自然 直观 和 容易 理解 ,便于 数据 库 设 计 人 员 与 不 熟悉 计算 机 的 用 户 
交换 意见 ,用 户 的 积极 参与 是 数据 库 成 功 的 关键 。 

(3) 易于 修改 和 扩充 

概念 模型 应 方便 进行 修改 和 补充 ,以 便 反 映 应 用 环境 和 应 用 要 求 发 生 的 变化 。 

(4) 易于 向 各 种 数据 模型 转换 

概念 模型 应 易于 向 关系 、 网 状 、 层 次 等 各 种 数据 模型 转换 ,易于 导出 与 DBMS 有 关 的 修 
辑 模 型 。 


5.3.2 概念 结构 设计 的 方法 


常用 的 概念 结构 设计 方法 有 以 下 四 种 : 

(1) 自 顶 向 下 的 设计 方法 

首先 定义 全 局 概念 结构 ,然后 再 逐步 细 化 得 到 完整 的 概念 结构 。 

(2) 自 底 向 上 的 设计 方法 

首先 定义 每 个 局 部 应 用 的 概念 结构 ,然后 按 一 定 的 规则 把 它们 集成 起 来 ,得 到 全 局 概念 
结构 。 

(3) 由 里 向 外 逐步 扩张 的 设计 方法 

首先 定义 最 重要 的 核心 概念 结构 ,然后 再 逐步 向 外 扩充 ,以 滚雪球 的 方式 逐步 生成 全 局 
概念 结构 。 

(4) 混合 策略 的 设计 方法 

采用 自 项 向 下 和 自 底 向 上 方法 相 结 合 的 方法 。 首 先 用 自 顶 向 下 策略 设计 一 个 全 局 概念 
结构 的 框架 ,然后 在 这 个 框架 下 ,集成 由 自 底 向 上 策略 设计 的 各 局 部 概念 结构 。 

概念 结构 设计 与 需求 分 析 关 联 起 来 ,最 常用 的 策略 是 自 顶 向 下 地 分 析 需 求 , 然 后 再 自 底 
向 上 地 设计 概念 结构 ,其 过 程 如 图 5-8 所 示 。 


~ 


1 需求 分 析 ( 自 


1 
一 | 一 

1 

1 

1 

1 

1 

1 

1 

1 

1 

1 

1 

1 
1 

1 

1 

1 

1 

1 

1 

1 
二 

1 

1 

1 

1 

1 

1 


概念 模型 1 2 概念 模型 n 


概念 结构 设计 ( 自 底 向 上 ) 


全 局 概念 模型 


5-8 自 顶 向 下 分 析 需 求 与 自 底 向 上 设计 概念 结构 


5.3.3 概念 结构 设计 的 步骤 


采用 图 5-8 所 示 的 设计 策略 , 自 底 向 上 设计 概念 结构 的 方法 分 为 两 步 : 第 一 步 是 抽象 
数据 并 设计 局 部 概念 结构 , 即 设计 局 部 应 用 E-R 图 ; 第 二 步 是 集成 局 部 概念 结构 ,即将 各 局 
部 应 用 E-R 图 综合 起 来 设计 得 到 全 局 E-R 图 , 即 全 局 概念 结构 。 其 设计 步骤 如 图 5-9 
所 示 。 
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丈 辑 结构 设计 


图 5-9 概念 结构 设计 的 步骤 


1. 数据 抽象 与 局 部 E-R 图 设计 

概念 结构 设计 首先 是 依据 需求 分 析 得 到 的 数据 流 图 和 数据 字典 等 数据 分 析 结 果 ,对 现 
实 世 界 进行 抽象 ,然后 进行 各 个 局 部 E-R 模型 的 设计 。 

(1) 数据 抽象 

所 谓 抽象 是 对 实际 的 人 、 物 、 事 和 概念 进行 人 为 处 理 , 抽 取 所 关心 的 共同 特性 ,忽略 非 本 
质 细节 ,并 把 这 些 特性 用 各 种 概念 准确 地 加 以 描述 ,由 这 些 概 念 组 成 某 种 模型 。 

概念 结构 设计 中 设计 局 部 E-R 图 的 关键 是 正确 地 划分 实体 和 属性 。 对 现实 世界 中 的 
事物 进行 数据 抽象 ,可 以 得 到 实体 和 属性 。 常 用 的 数据 抽象 技术 有 两 种 : 分 类 和 聚集 。 

@ 分 类 (Classification) 

分 类 是 定义 某 一 类 概念 作为 现实 世界 中 一 组 对 象 的 类 型 ,将 一 组 具有 某 些 共 同 特征 和 
行为 的 对 象 抽 象 为 一 个 实体 。 对 象 和 实体 之 间 是 is a member of 的 关系 。 

例如 在 某 教学 管理 系统 中 ,“ 王 阳 ” 是 一 名 学 生 , 表 示 对 象 “ 王 阳 ” 是 实体 “学 生 ” 中 的 一 
员 , 具 有 学 生 共 同 的 特性 和 行为 。 

@ 聚集 (Aggregation) 

聚集 是 定义 某 一 类 型 的 组 成 成 分 ,将 对 象 类 型 的 组 成 成 分 抽象 为 实体 属性 。 组 成 成 分 
与 对 象 类 型 之 间 是 is a part of 的 关系 。 在 E-R 模型 中 若干 个 属性 的 聚集 就 组 成 了 一 个 实 
体型 。 

例如 ,学 号 姓名、 性 别 及 专业 等 属性 可 聚集 为 “学生 ”实体 。 

(2) 局 部 E-R 图 设计 

在 需求 分 析 阶 段 已 经 得 到 了 系统 的 多 层 数据 流 图 、 数 据 字典 及 系统 需求 规格 说 明 书 。 
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建立 局 部 E-R 图 ,就 是 根据 系统 的 具体 情况 ,在 多 层 数 据 流 图 中 选择 一 个 适当 层次 的 数据 
流 图 ,作为 E-R 图 设计 的 出 发 点 ,在 这 组 图 中 的 每 个 部 分 对 应 一 个 局 部 应 用 ,一 般 选 取 能 够 
较 好 地 反映 系统 中 各 局 部 应 用 组 成 部 分 的 中 层 数 据 流 图 作为 设计 的 依据 ,对 于 每 个 局 部 应 
用 逐一 设计 局 部 E-R 图 。 

在 选 好 的 某 一 层次 的 数据 流 图 中 ,每 个 局 部 应 用 都 对 应 了 一 组 数据 流 图 ,与 局 部 应 用 相 
关 的 数据 信息 在 数据 字典 中 已 有 详细 描述 。 现 在 要 将 这 些 数据 从 数据 字典 中 抽取 出 来 , 参 
照 数据 流 图 ,确定 每 个 局 部 应 用 包含 的 实体 、 属 性 及 实体 的 码 , 并 根据 数据 流 图 中 表示 的 对 
数据 的 处 理 ,确定 实体 之 间 的 联系 以 及 联系 的 类 型 。 

在 现实 世界 具体 的 应 用 环境 中 ,实体 和 属性 仅 有 大 致 的 自然 划分 ,没有 确切 的 划分 界 
限 。 经 过 数据 抽象 后 得 到 的 实体 和 属性 ,需要 根据 实际 情况 进行 调整 。 在 调整 中 应 遵循 以 
下 两 条 原则 。 

Q@ 实体 具有 描述 信息 ,属性 没有 。 即 属性 必须 是 不 可 再 分 的 数据 项 ,不 能 再 由 另 一 些 
属性 组 成 。 

@ 属性 不 能 与 其 他 实体 具有 联系 ,E-R 图 中 的 联系 是 指 实体 之 间 的 联系 。 

例如 ,学 生 是 一 个 实体 ,学 号 、 姓 名 性别、 年 龄 和 所 属 学 院 等 是 学 生 实 体 的 属性 。 如 果 
没有 其 他 需求 , 则 “学院 ”作为 一 个 属性 存在 就 可 以 了 ,但 如 果 还 需要 存储 “学院 ” 的 名 称 .学 
生 人 数 、 办 公 地 点 等 , 则 “学 院 ” 就 应 该 作为 一 个 实体 。 图 5-10 说 明 “ 学 院 ” 调 整 为 实体 后 
E-R 图 的 变化 。 
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5-10 “学 院 " 作 为 一 个 属性 或 实体 的 E-R 图 


【 例 2】 高 校 教学 管理 系统 局 部 E-R 图 的 设计 。 

在 某 高 校 的 教学 管理 系统 中 ,依据 对 数据 流 图 及 数据 字典 的 分 析 与 抽象 ,具有 如 下 语义 
描述 。 

中 一 名 学 生 可 同时 选修 多 门 课程 ,一 门 课程 也 可 被 多 名 学 生 选 修 ,学 生 和 课程 是 多 对 
多 的 联系 ; 一 名 学 生 已 选修 的 每 门 课程 有 一 个 教师 授课 ,同时 产生 一 个 成 绩 。 

@ 一 名 教师 可 讲授 多 门 课程 ,一 门 课程 可 由 多 名 教师 讲授 ,教师 和 课程 是 多 对 多 的 
联系 。 

@ 一 个 学 院 可 拥有 多 名 学 生 ,一 名 学 生 只 属于 一 个 学 院 ,学 院 和 学 生 是 一 对 多 的 联系 。 

@ 一 个 单位 ( 即 部 门 ) 可 有 多 名 教师 ,一 名 教师 只 属于 一 个 单位 ,单位 和 教师 是 一 对 多 


的 联系 。 

解 : 根据 上 述 语义 描述 可 知 ,该 系统 共有 五 个 实体 : 学 生 、 课 程 教 师 、 学 院 和 单位 。 这 
五 个 实体 的 属性 如 下 ,其 中 的 码 属性 用 下 面 线 标识 : 

学 生 : 学 号 ,姓名 ,性 别 ,出 生日 期 

课程 : 课程 编号 ,课程 名 称 ,学 分 ,学 时 ,课程 类 别 ,课程 性 质 

教师 : 教师 编号 ,教师 姓名 ,性 别 ,职称 

学 院 : 学 院 编号 ,学 院 名 称 , 学 生 人 数 ,办 公 地 点 

单位 : 单位 名 称 ,教师 人 数 ,办 公 电 话 

依据 以 上 分 析 设 计 的 学 生 选 修 课程 教师 讲授 课程 .学院 拥有 学 生 及 教师 所 属 单位 的 局 
部 E-R 图 分 别 如 图 5-11 一 图 5-14 所 示 。 
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图 5-11 学 生 选 修 课程 的 局 部 E-R 图 
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图 5-12 教师 讲授 课程 的 局 部 E-R 图 
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图 5-13 学 院 拥有 学 生 的 局 部 E-R 图 
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图 5-14 教师 所 属 部 门 的 局 部 E-R 图 


局 部 E-R 图 设计 完成 后 ,数据 库 设 计 人 员 应 该 征求 用 户 意见 ,修改 完善 以 满足 用 户 需 
求 ,然后 进行 全 局 E-R 图 设计 。 

2. 全 局 E-R 图 设计 

集成 各 局 部 E-R 图 形成 全 局 E-R 图 的 集成 方式 有 两 种 。 
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g@ 一 次 集成 : 将 多 个 局 部 E-R 图 一 次 合并 为 全 局 E-R 图 。 

@ 逐步 集成 : 首先 集成 两 个 重要 的 局 部 E-R 图 ,以 后 用 累加 的 方法 逐步 将 一 个 新 的 下 - 
R 图 集成 进来 。 

在 实际 应 用 中 ,可 以 根据 系统 复杂 性 选用 集成 方式 。 一 般 采 用 逐步 集成 方式 , 即 每 次 只 
综合 两 个 局 部 E-R 图 ,可 降低 复杂 度 。 无 论 使 用 哪 种 集成 方式 ,集成 局 部 E-R 图 均 分 为 两 
个 步骤 ,如 图 5-15 所 示 。 

O@ 合并 : 合并 局 部 E-R 图 ,消除 局 部 E-R 图 之 间 的 冲突 ,生成 初步 ER 图 。 

@ 优化 : 消除 不 必要 的 宙 余 ,生成 基本 E-R 图 。 
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图 5-15 集成 局 部 ER 图 的 步骤 


下 面 通过 实例 详细 介绍 集成 局 部 E-R 图 、 生 成 基本 E-R 图 的 设计 过 程 。 

(1) 合并 局 部 ER 图 ,生成 初步 E-R 图 。 

将 局 部 E-R 图 集成 为 全 局 E-R 图 时 ,由 于 各 个 局 部 E-R 图 面向 不 同 的 问题 , 且 由 不 同 
的 设计 人 员 进 行 局 部 设计 ,导致 各 个 局 部 E-R 图 之 间 存 在 许多 不 一 致 , 称 之 为 冲突 。 因 此 ， 
合理 消除 冲突 是 合并 局 部 E-R 图 时 需要 完成 的 主要 工作 。 

局 部 E-R 图 之 间 的 冲突 主要 有 三 类 : 属性 冲突 、 命 名 冲突 和 结构 冲突 。 

@ 属性 冲突 

属性 冲突 分 为 属性 域 冲突 和 属性 取 值 单位 冲突 。 

属性 域 冲突 : 即 属性 的 类 型 取 值 范围 或 取 值 集合 不 同 。 例 如 ,在 有 些 局 部 应 用 中 将 学 
号 定义 为 字符 型 ,在 另外 的 局 部 应 用 中 又 将 其 定义 为 数值 型 ; 又 如 对 学 生出 生日 期 有 些 局 
部 应 用 将 其 定义 为 日 期 型 有些 则 将 其 定义 为 字符 型 。 

属性 取 值 单位 冲突 : 例如 学 生体 重 , 有 的 以 公斤 为 单位 有 的 以 斤 为 单位 。 

@ 命名 冲突 

命名 冲突 可 能 发 生 在 实体 名 、 属 性 名 或 联系 名 之 间 , 其 中 属性 的 命名 冲突 更 为 常见 。 一 
般 分 为 同名 异 义 和 异 名 同 义 。 

同名 异 义 : 即 不 同意 义 的 实体 名 、 联 系 名 或 属性 名 在 不 同 的 局 部 应 用 中 具有 相同 的 名 
字 。 例 如 ,“ 单 位 ”在 某 些 局 部 表示 人 员 所 在 的 部 门 , 而 在 某 些 局 部 又 表示 物品 的 重量 、 长 度 
等 属性 。 

异 名 同 义 : 具有 相同 意义 的 实体 名 、 联 系 名 和 属性 名 在 不 同 的 局 部 应 用 中 具有 不 同 的 


名 字 。 如 科研 项 目 , 在 财务 部 门 称 为 项 目 ,在 科研 处 称 为 课题 。 

属性 冲突 和 命名 冲突 通常 可 以 通过 讨论 .与 用 户 协商 等 方法 解决 。 

@ 结构 冲突 

结构 冲突 分 为 三 种 情况 : 

第 1 种 情况 : 同一 数据 项 在 不 同 应 用 中 有 不 同 的 抽象 ,有 的 作为 属性 ,有 的 作为 实体 。 
例如 ,教师 的 属性 “职称 ”可 能 在 某 一 局 部 应 用 中 作为 实体 ,而 在 另 一 局 部 应 用 中 又 作为 
属性 。 

解决 这 种 冲突 必须 根据 实际 情况 而 定 ,是 把 属性 转换 为 实体 还 是 把 实体 转换 为 属性 ,应 
符合 局 部 E-R 图 设计 时 调整 的 基本 原则 。 

第 2 种 情况 : 同一 实体 在 不 同 的 局 部 E-R 图 中 属性 组 成 不 同 , 所 包含 的 属性 个 数 和 属 
性 次 序 不 同 。 

解决 这 种 冲突 的 办 法 是 合并 后 实体 的 属性 为 各 局 部 E-R 图 中 属性 的 并 集 , 然 后 再 适当 
调整 属性 的 次 序 。 

第 3 种 情况 : 两 个 实体 之 间 的 同一 联系 在 不 同 的 应 用 中 呈现 不 同 的 类 型 ,在 某 个 应 用 
中 可 能 是 一 对 多 联系 ,而 在 男 一 个 应 用 中 是 多 对 多 联系 。 

这 种 冲突 的 解决 办 法 是 根据 应 用 的 环境 综合 分 析 , 对 实体 间 的 联系 进行 相应 调整 。 

【 例 3】 高 校 教学 管理 系统 局 部 E-R 图 合并 生成 初步 E-R 图 。 

解 : 教学 管理 系统 局 部 E-R 图 合并 的 过 程 分 为 三 步 。 

第 一 步 ,合并 图 5-11 和 图 5-13 所 示 的 局 部 E-R 图 。 这 两 个 局 部 E-R 图 中 不 存在 冲突 ， 
合并 后 的 结果 如 图 5-16 所 示 。 
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5-16 合并 学 生 选 修 课 程 和 学 院 拥 有 学 生 的 局 部 ER 


第 二 步 ,合并 图 5-12 和 图 5-14 所 示 的 局 部 E-R 图 。 这 两 个 局 部 E-R 图 也 不 存在 冲突 ， 
合并 后 的 结果 如 图 5-17 所 示 。 

第 三 步 ,将 合并 后 的 两 个 局 部 E-R 图 , 即 图 5-16 和 图 5-17 合并 为 全 局 E-R 图 ,如 
图 5-18 所 示 , 合 并 时 存在 三 个 冲突 。 

QO@ 两 个 局 部 E-R 图 中 都 有 “课程 "实体 .但 所 包含 的 属性 不 完全 相同 , 即 存 在 结构 冲突 。 
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5-17 合并 教师 讲授 课程 和 教师 所 属 部 门 的 局 部 ER 图 


为 了 消除 冲突 合并 后 “课程 ”实体 的 属性 是 两 个 局 部 E-R 图 中 “课程 ”实体 属性 的 并 集 。 
图 5-18 所 示 的 E-R 图 已 消除 该 冲突 。 

@ 命名 冲突 :“ 学 院 " 实 体 和 "单位 ”实体 代表 的 含义 基本 相同 ,属于 命名 冲突 异 名 同 
义 , 因 此 可 将 这 两 个 实体 合并 为 一 个 实体 “学 院 ”。 原 "学院" 实体 中 有 一 个 属性 是 学院 名 ”， 
而 在 原 “ 单 位 ”实体 中 将 这 个 含义 相同 的 属性 命名 为 “单位 名 ”, 即 存在 异 名 同 义 属性 。 合 并 
后 可 统一 为 “学 院 名 ”。 

@ 结构 冲突 :“ 学 院 " 实 体 包含 的 属性 是 学 院 名 、 学 生 人 数 和 办 公 地 点 ,而 “单位 ”实体 
包含 的 属性 是 单位 名 教师 人 数 和 办 公 电 话 。 因 此 在 合并 后 的 实体 “学 院 ”" 中 应 包含 这 两 个 
实体 的 全 部 属性 。 

图 5-18 所 示 的 E-R 图 消除 以 上 三 种 冲突 后 ,生成 初步 E-R 图 (图 略 )。 
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5-18 合并 后 的 全 局 E-R 图 


(2) 优化 初步 E-R 图 ,生成 基本 E-R 图 。 
合并 局 部 E-R 图 消除 冲突 后 ,所 形成 的 初步 E-R 图 中 可 能 存在 一 些 宛 余 的 数据 和 实体 


间 宛 余 的 联系 。 所 谓 宛 余 的 数据 是 指 可 由 基本 数据 导出 的 数据 , 宛 余 的 联系 是 指 可 由 其 他 
联系 导出 的 联系 。 宛 余数 据 和 宛 余 联 系 容易 破坏 数据 库 的 完整 性 ,给 数据 库 维护 增加 困难 ， 
应 当 予 以 消除 。 消 除了 宛 余 后 的 初步 E-R 图 称 为 基本 ER 图 。 

消除 宛 余 主要 采用 分 析 方 法 , 即 以 数据 字典 和 数据 流 图 为 依据 ,分 析 消 除 元 余数 据 及 完 
余 联 系 。 但 并 不 是 所 有 的 元 余数 据 与 元 余 联 系 都 必须 加 以 消除 ,有 时 候 适 当 的 宛 余 可 以 提 
高 数据 查询 效率 。 除 分 析 方 法 外 ,还 可 以 用 规范 化 理论 来 消除 元 余 。 

在 例 3 教学 管理 系统 中 ,全 局 ER 图 (图 5-18) 消 除 结构 冲突 与 命名 冲突 后 得 到 初步 E-R 
图 。 分 析 初步 E-R 图 发 现 “ 课 程 "实体 中 的 属性 “教师 号 "可 由 联系 “授课 ”导出 ,所 以 “课程 ” 
实体 中 的 “教师 号 ”属于 宛 余数 据 。 这样, 图 5-18 的 全 局 E-R 图 在 消除 冲突 及 宛 余 数据 后 ， 
得 到 优化 后 系统 的 基本 E-R 图 ,如 图 5-19 所 示 。 
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图 5-19 优化 后 的 基本 E-R 图 


基本 E-R 图 是 应 用 系统 中 数据 库 的 概念 模型 ,代表 了 用 户 的 数据 要 求 , 是 数据 库 迎 辑 
结构 设计 的 基础 ,是 成 功 建立 数据 库 的 关键 因素 。 因 此 ,用 户 和 数据 库 设计 人 员 必 须 对 概念 
模型 反复 讨论 ,直至 得 到 用 户 最 终 确 认 的 概念 模型 才能 进入 逮 辑 结构 设计 阶段 。 


5.4 ”逻辑 结构 设计 


E-R 图 所 表示 的 概念 模型 是 表达 用 户 需 求 的 信息 模型 ,为 了 建立 用 户 需 求 的 数据 库 , 需 
要 将 概念 模型 转换 成 某 个 具体 的 DBMS 所 支持 的 数据 模型 ,如 网 状 模型 .层次 模型 ,关系 模 
型 和 面向 对 象 模型 等 。 逻 辑 结 构 设 计 的 任务 是 把 概念 模型 转换 为 与 选用 的 DBMS 所 支持 
的 数据 模型 相符 合 的 逻辑 结构 。 

目前 的 数据 库 应 用 系统 大 都 采用 支持 关系 数据 模型 的 关系 数据 库 管理 系统 ,本 节 仅 讨 
论 关 系数 据 库 的 逻辑 结构 设计 问题 ,介绍 E-R 图 向 关系 数据 模型 的 转换 原则 与 方法 。 

关系 数据 库 的 逻辑 结构 设计 一 般 包含 三 部 分 内 容 : 

(1) E-R 模型 向 关系 模型 的 转换 。 

(2) 关系 模型 的 优化 。 
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(3) 用 户 子 模式 的 设计 。 
S.4.1 FE-R 模型 向 关系 模型 的 转换 


E-R 模型 是 由 实体 、 实 体 的 属性 以 及 实体 之 间 的 联系 组 成 的 ,关系 模型 的 逻辑 结构 是 一 
组 关系 模式 的 集合 。 因 此 ,E-R 模型 向 关系 模型 的 转换 要 解决 的 问题 ,是 如 何 将 实体 以 及 实 
体 间 的 联系 转换 为 关系 模式 ,如 何 确定 这 些 关系 模式 的 属性 和 码 。 

下 面 介 绍 转换 中 应 遵循 的 原则 及 转换 实例 ,实例 中 带 下 面 线 的 属性 是 码 。 

1. 实体 的 转换 原则 

E-R 图 中 的 一 个 实体 转换 为 一 个 关系 模式 ,实体 的 属性 就 是 关系 的 属性 ,实体 的 码 就 是 
关系 的 主 码 。 

【 例 4】 将 图 5-19 中 的 学 生 、 学 院 两 个 实体 分 别 转 换 为 关系 模式 。 

解 : 依据 图 5-19 中 的 E-R 图 ,学 生 、 学 院 两 个 实体 转换 的 关系 模式 如 下 : 

学 生 ( 学 号 ,姓名 ,性 别 ,出 生日 期 ) 

学 院 (学 院 名 ,教师 人 数 ,学 生 人 数 ,办 公 地 点 ,办 公 电话 ) 

2. 实体 间 联 系 的 转换 原则 

对 于 E-R 图 中 实体 间 的 联系 转换 为 关系 模式 ,依据 联系 的 类 型 采取 相应 的 转换 原则 ， 
分 为 以 下 几 种 情况 。 

(1) 1: 1 联系 的 转换 方法 

一 个 1: 1 联系 可 以 转换 为 一 个 独立 的 关系 模式 ,也 可 以 与 任意 一 端 对 应 的 关系 模式 合 
并 。 转 换 规 则 如 下 

如 果 将 1 : 1 联系 转换 为 一 个 独立 的 关系 模式 , 则 与 该 联系 相连 的 各 实体 的 码 以 及 其 本 
身 的 属性 均 转 换 为 关系 的 属性 ,每 个 实体 的 码 均 是 该 关系 的 候选 码 。 

如 果 将 1 : 1 联系 与 某 一 端 实体 对 应 的 关系 模式 合并 , 则 需要 在 该 关系 模式 的 属性 中 加 
人 另 一 个 关系 模式 的 码 和 联系 本 身 的 属性 ,该 关系 模式 的 码 不 变 。 

【 例 5】 将 图 5-20 所 示 的 E-R 图 转换 为 关系 模型 。 

解 : 实体 “班长 ”与 “班级 "之 间 的 联系 属于 1:1 
联系 ,有 三 种 转换 方案 : 

中 方案 1:“ 任 职 ”联系 转换 为 独立 的 关系 模式 。 FF 了 | 1 
转换 后 的 关系 模型 为 ; 

班长 (学 号 ,姓名 ,性 别 ,出 生日 期 ,学 院 名 ) 


班级 ( 班 号 ,人 数 ) 
任职 (学 号 , 班 号 ,任职 时 间 ) 


@ 方案 2: 将 关系 “任职 "与 “班长 ”的 关系 合并 。 转 换 后 的 关系 模型 为 : 


班长 (学 号 ,姓名 ,性 别 ,出 生日 期 ,学 院 名 , 班 号 ,任职 时 间 ) 
班级 ( 班 号 ,人 数 ) 


@ 方案 3: 将 关系 “任职 ”与 “班级 "的 关系 合并 。 转 换 后 的 关系 模型 为 : 


班长 (学 号 ,姓名 ,性 别 ,出 生日 期 ,学 院 名 ) 
班级 ( 班 号 ,人 数 ,学 号 ,任职 时 间 ) 


5-20 班长 任职 E-R 


(2) 1 : n 联系 的 转换 方法 

一 个 1:n 联系 可 以 转换 为 一 个 独立 的 关系 模式 ,也 可 以 与 n 端 实体 对 应 的 关系 模式 合 
并 。 转 换 规则 如 下 : 

如 果 将 1 : n 联系 转换 为 一 个 独立 的 关系 模式 , 则 与 该 联系 相连 的 各 实体 的 码 以 及 联系 
本 身 的 属性 均 转 换 为 关系 的 属性 ,而 关系 的 码 为 n 端 实体 的 码 。 

如 果 将 1 : n 联系 与 n 端 实体 合并 , 则 是 将 1 端 实体 的 主 码 纳 入 n 端 实体 所 对 应 的 关系 
模式 中 ,并 将 联系 本 身 的 属性 也 加 入 n 端 实体 的 关系 模式 中 ,n 端 关 系 的 码 不 变 。 

【 例 6】 将 图 5-21 所 示 的 E-R 图 转换 为 关系 模型 。 

解 : 实体 “宿舍 ”与 “学 生 ” 之 间 是 1 : n 的 联系 , 依 
据 转换 规则 有 两 种 转换 方案 。 

g 方案 1:“ 居 住 ? 联 系 转换 为 一 个 独立 的 关系 
模式 。 

学 生 ( 学 号 ,姓名 ,性 别 , 出 生日 期 ,学 院 名 ) 


宿舍 (门牌 号 ,床位 数 ) 
居住 (学 号 ,门牌 号 ,居住 时 间 ) 


@ 方案 2:“ 居 住 ”联系 与 n 端 实体 对 应 的 关系 模式 合并 。 

宿舍 (门牌 号 ,床位 数 ) 

学 生 ( 学 号 ,姓名 ,性 别 ,出 生日 期 ,学 院 名 ,门牌 号 ,居住 时 间 ) 

(3) m : n 联系 的 转换 方法 

一 个 m : n 联系 只 可 转换 为 一 个 关系 模式 ,与 该 联系 相连 的 各 实体 的 码 以 及 联系 本 身 
的 属性 均 转 换 为 关系 的 属性 ,各 实体 的 码 组 成 关系 的 码 或 关系 码 的 一 部 分 。 

【 例 7】 将 图 5-11 所 示 的 E-R 图 转换 为 关系 模型 。 

解 : 图 5-11 中 实体 “学 生 ” 与 “课程 > 之 间 是 m : n 的 联系 ,依据 转换 规则 转换 后 的 关系 
模型 包括 以 下 关系 模式 。 

Q@ 每 个 实体 转换 为 一 个 独立 的 关系 模式 。 


学 生 ( 学 号 ,姓名 ,性 别 ,出 生日 期 ) 
课程 (课程 号 ,课程 名 称 ,课程 类 别 ,课程 性 质 ,学 分 ,教师 号 ) 


@ m:n 的 联系 转换 为 独立 的 关系 模式 。 

选修 (学 号 ,课程 号 ,成 绩 ) 

选修 关系 的 主 码 是 学 生 实体 的 主 码 和 课程 实体 的 主 码 的 组 合 。 

(4) 多 元 联系 的 转换 方法 

三 个 或 三 个 以 上 实体 间 的 一 个 多 元 联系 可 以 转换 为 一 个 关系 模式 。 与 该 多 元 联系 相连 
的 各 实体 的 码 以 及 联系 本 身 的 属性 均 转 换 为 关系 的 属性 ,各 实体 的 码 组 成 关系 的 码 或 关系 
码 的 一 部 分 。 

【 例 8〗 将 图 5-22 所 示 的 E-R 图 转换 为 关系 模型 。 

解 : 

O 分 析 各 实体 的 属性 为 : 


5-21 学 生 居住 宿舍 E-R 图 
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-一 售货员 : 售货员 编号 ,姓名 ,性 别 ,年 龄 ,工龄 
售货员 顾客 : 顾客 编号 ,顾客 名 称 ,住址 ,电话 
商品 : 商品 编号 ,商品 名 称 , 价格 , 进货 时 间 


@ 转换 以 后 的 关系 模型 为 : 


售货员 (售货员 编号 ,姓名 ,性 别 ,年 龄 ,工龄 ) 
顾客 (顾客 编号 ,顾客 名 称 ,住址 , 电话 ) 
商品 (商品 编号 ,商品 名 称 , 价格, 进货 时 间 ) 


图 5-22 商品 顾客 售货员 


多 元 联系 瑟 RR 图 销售 (售货员 编号 ,顾客 编号 ,商品 编号 ,销售 量 ) 
销售 关系 的 主 码 为 售货员 编号 .顾客 编号 及 商品 编号 这 三 个 属性 的 组 合 。 
3. 关系 合并 规则 


E-R 模型 转换 为 关系 模型 后 ,关系 模型 中 具有 相同 码 的 关系 模式 可 根据 实际 需求 合并 
为 一 个 关系 模式 。 如 例 5 的 方案 1 ,将 任职 联系 转换 成 独立 的 关系 模式 , 则 候选 码 有 学 号 、 
班 号 。 如 果 选 择 学 号 作 主 码 , 则 该 独立 的 关系 模式 与 学 生 关 系 模式 具有 相同 的 主 码 ( 学 号 )， 
两 个 关系 模式 可 以 合并 ,合并 的 结果 与 方案 2 的 结果 相同 。 同 理 , 如 果 选 择 班 号 作 主 码 , 则 
该 独立 的 关系 模式 与 班级 关系 模式 具有 相同 的 主 码 ( 班 号 ) ,两 个 关系 模式 可 以 合并 ,合并 的 
结果 与 方案 3 的 结果 相同 。 

【 例 9】 将 图 5-19 的 基本 E-R 图 转换 为 关系 模型 。 

解 : 根据 上 述 转换 规则 ,转换 过 程 可 以 分 为 三 步 。 

中 实体 的 转换 

每 个 实体 转换 为 独立 的 关系 模式 ,转换 后 的 关系 模式 为 : 

学 生 ( 学 号 ,姓名 ,性 别 ,出 生日 期 ) 

教师 (教师 号 ,姓名 ,性 别 ,职称 ) 

课程 (课程 号 ,课程 名 称 ,课程 类 别 , 课程 性 质 , 学 时 ,学 分 ) 

学 院 (学 院 名 ,学 生 人 数 ,教师 人 数 ,办 公 地 点 ,办 公 电 话 ) 

@ 1:n 联 系 的 转换 

1 :mn 联系 与 n 端 实体 合并 ,联系 “拥有 ”与 实体 “学 生 " 合 并 ,联系 “属于 ”与 实体 “教师 ” 
合并 ,转换 后 实体 “学 生 ” 与 “教师 ”的 关系 模式 变 为 

学 生 ( 学 号 ,姓名 ,性 别 ,出 生日 期 ,学 院 名 ) 

教师 (教师 号 ,姓名 ,性 别 , 职称 ,学 院 名 ) 

@@ m:n 联系 的 转换 

m:n 联系 转换 为 独立 的 关系 模式 ,联系 “选修 ”及 “授课 ”转换 后 的 关系 模式 为 : 

选修 (学 号 ,课程 号 , 成绩) 

授课 (教师 号 ,课程 号 ,开课 学 期 ) 

授课 关系 的 主 码 是 教师 号 .课程 号 .开课 学 期 三 个 属性 的 组 合 。 

综 上 经 过 三 步 转换 ,图 5-19 的 基本 E-R 图 转换 为 具有 “学 生 ”“ 教 师 ”“ 课 程 “ 学 院 ”“ 选 
修 “ 授 课 " 六 个 关系 模式 的 关系 模型 。 


5.4.2 关系 模型 的 优化 
为 了 满足 用 户 对 应 用 系统 的 功能 需求 及 性 能 需求 ,根据 具体 情况 ,需要 对 由 E-R 模型 


转换 形成 的 关系 数据 模型 进行 优化 ,关系 规范 化 理论 是 优化 关系 模型 有 效 的 指南 和 工具 。 
优化 过 程 大 致 分 为 两 步 。 

1. 确定 关系 模式 的 范式 级 别 

首先 分 析 确定 每 个 关系 模式 中 各 属性 之 间 的 数据 依赖 关系 以 及 不 同 关系 模式 中 各 属性 
之 间 的 数据 依赖 关系 。 分 析 各 关系 模式 是 否 存在 部 分 函数 依赖 .传递 函数 依赖 及 多 值 依赖 
等 ,然后 判断 各 关系 模式 分 别 属 于 第 几 范式 。 

2. 关系 模式 评价 及 改进 

根据 需求 分 析 阶 段 得 到 的 各 项 功能 处 理 及 性 能 指标 要 求 ,分析 评 价 并 确定 各 关系 模式 
是 否 满足 用 户 的 功能 要 求 , 同 时 对 性 能 进行 预测 ,并 判断 各 关系 模式 是 否 满足 用 户 的 需求 ， 
是 否 需 要 对 某 些 模式 进行 分 解 或 合并 。 对 于 一 个 具体 的 数据 库 应 用 系统 ,数据 库 模 式 到 底 
规范 到 什么 程度 ,需要 设计 人 员 综 合 考 虑 多 种 因素 ,权衡 利弊 ,然后 合理 确定 。 

(1) 合并 

如 果 有 若干 个 关系 模式 具有 相同 的 码 , 并 且 对 这 些 关 系 模式 的 处 理 经 常 是 多 关系 的 连 
接 查 询 操 作 , 那 么 可 对 这 些 关 系 模式 进行 合并 以 提高 查询 效率 。 

(2) 分 解 

为 了 提高 数据 操作 的 效率 和 存储 空间 的 利用 率 , 最 常用 的 关系 模式 优化 方法 就 是 分 解 ， 
关系 模式 的 分 解 有 两 种 方式 : 水 平分 解 和 垂直 分 解 。 

Q@ 水 平分 解 

水 平分 解 是 把 关系 的 元 组 以 时 间 .空间 ,类 型 等 属性 取 值 为 条 件 分 为 若干 个 子 集合 ， 
每 个 子 集合 构成 一 个 子 关系 ,对 于 经 常 进行 大 量 数据 的 分 类 条 件 查询 的 关系 进行 水 平分 解 ， 
可 以 减少 每 次 查询 访问 的 记录 数 ,提高 了 查询 效率 。 

【 例 10】 某 高 校 教学 管理 系统 在 查询 学 生 信息 时 ,经 常 查询 在 校生 信息 ,有 时 也 查询 
毕业 生 的 相关 信息 。 为 改善 信息 系统 性 能 ,使 单位 时 间 内 访问 逻辑 记录 的 个 数 尽量 少 , 试 完 
成 对 学 生 关系 的 水 平分 解 。 

解 : 原始 学 生 关 系 为 : 


学 生 ( 学 号 ,姓名 ,性 别 ,出 生日 期 ,学 院 名 ) 


将 学 生 关系 水 平分 解 为 两 个 关系 。 

一 个 关系 用 来 存放 在 校生 的 信息 , 另 一 个 关系 用 来 存放 毕业 生 的 信息 ,两 个 关系 模式 
如 下 : 

在 校生 (学 号 ,姓名 ,性 别 ,出 生日 期 ,学 院 名 ) 

毕业 生 ( 学 号 ,姓名 ,性 别 ,出 生日 期 ,学 院 名 ) 

分 解 后 , 当 查 询 在 校生 或 毕业 生 的 信息 时 ,就 只 需 在 相应 的 关系 中 查找 ,显然 单位 时 间 
内 访问 的 记录 数量 大 大 减少 了 。 

@ 垂直 分 解 
垂直 分 解 是 把 关系 模式 的 属性 以 非 主 属性 所 描述 的 数据 特征 为 条 件 , 分 解 为 若干 个 子 
集合 ,形成 若干 个 子 关系 模式 ,垂直 分 解 的 原则 是 把 描述 一 类 相同 特征 的 属性 划分 在 一 个 子 
集合 中 ,形成 一 个 子 关系 模式 。 垂 直 分 解 要 保证 分 解 后 的 关系 具有 无 损 连接 性 和 函数 依赖 
保持 性 。 
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【 例 11】 试 完成 对 关系 模式 教师 (教师 号 ,姓名 ,性 别 ,年 龄 ,职称 ,家 庭 住址 ,联系 电 
话 ) 的 垂直 分 解 。 

解 : 依据 对 各 属性 使 用 情况 的 分 析 , 教 师 关系 可 垂直 分 解 为 两 个 关系 模式 : 

教师 基本 信息 (教师 号 ,姓名 , 性别, 年龄 , 职称 ) 

教师 家 庭 信息 (教师 号 ,家 庭 住址 ,联系 电话 ) 

分 解 后 , 当 查 询 教师 基本 信息 或 教师 家 庭 信 息 时 ,就 只 需 在 相应 的 关系 中 查找 ,与 原始 
关系 相 比 ,查询 时 每 条 记录 的 属性 减少 了 ,因此 减少 了 数据 传递 量 , 提 高 了 查询 速度 。 

经 过 对 关系 模式 的 评价 及 改进 ,最 终 确定 的 一 组 用 户 满意 的 符合 规范 化 要 求 的 关系 模 
式 , 即 为 关系 数据 库 的 全 局 逻辑 模型 。 


5.4.3 用 户 子 模式 的 设计 


数据 库 模 式 也 称 为 巡 辑 模式 ,描述 数据 库 的 全 局 逮 辑 结构 ,综合 考虑 了 所 有 用 户 的 需 
求 。 外 模式 也 称 子 模式 或 用 户 模式 ,描述 与 某 一 应 用 有 关 的 数据 的 局 部 巡 辑 结构 。 由 于 不 
同 的 用 户 对 数据 的 需求 不 同 ,因此 不 同 用 户 的 子 模式 描述 的 数据 内 容 是 不 同 的 。 将 数据 库 
系统 的 概念 模型 转换 为 全 局 逻辑 模型 后 ,还 应 该 根据 不 同 用 户 的 局 部 应 用 需求 ,结合 DBMS 
设计 用 户 子 模式 。 一 个 数据 库 只 有 一 个 模式 ,对 应 于 同一 数据 库 模式 可 以 有 任意 多 个 子 

目前 关系 数据 库 管理 系统 一 般 都 支持 视图 概念 ,可 以 利用 这 一 功能 实现 用 户 子 模式 的 
设计 。 

设计 数据 库 的 模式 主要 考虑 系统 的 功能 ,时间 效 率 、 空 间 效率 、 易 维护 等 因素 。 外 模式 
通常 是 模式 的 子 集 ,同时 与 模式 又 是 相对 独立 的 ,设计 用 户 子 模式 时 只 需 考 虑 用 户 对 数据 的 
使 用 要 求 .习惯 及 安全 性 要 求 。 设 计数 据 库 的 用 户 子 模式 时 应 考虑 如 下 问题 。 

1. 使 用 更 符合 用 户 习 惯 的 别名 

在 概念 结构 设计 阶段 集成 各 局 部 E-R 图 生成 全 局 E-R 图 过 程 中 ,进行 了 消除 命名 冲突 
的 工作 ,在 设计 数据 库 的 全 局 结构 时 这 项 工作 是 非常 必要 的 。 但 命名 统一 后 会 使 某 些 局 部 
用 户 感 到 不 习惯 ,在 设计 用 户 子 模式 时 ,可 以 利用 视图 的 功能 ,对 用 户 子 模式 中 的 关系 和 属 
性 名 重新 命名 ,使 其 与 用 户 习 惯 一 致 ,以 方 使 用 户 的 使 用 。 
2. 为 保证 数据 的 安全 ,可 以 对 不 同 级 别 的 用 户 定义 不 同 的 子 模式 
由 于 视图 能 够 对 表 中 的 行 和 列 进 行 限制 ,因此 对 不 同 级 别 的 用 户 定义 不 同 的 视图 即 子 
模式 ,可 以 保证 系统 数据 的 安全 性 。 

【 例 12〗 设 有 关系 模式 教师 (教师 号 ,姓名 ,性 别 , 部 门 ,职称 ,学 历 ,专业 ,参加 工作 时 
间 , 基 本 工资 ,绩效 工资 ,联系 电话 ), 试 分 析 建 立 用 户 子 模式 。 

解 : 为 关系 模式 教师 建立 如 下 三 个 用 户 子 模式 ( 即 三 个 视图 ) : 

中 教师 基本 信息 (教师 号 ,姓名 ,性 别 , 部 门 ,职称 ,联系 电话 ) 

@ 教师 综合 信息 (教师 号 ,姓名 ,性 别 ,部 门 , 学 历 , 专 业 ,参加 工作 时 间 ,联系 电话 ) 

@@ 教师 工资 信息 (教师 号 ,姓名 ,部 门 , 基 本 工资 ,绩效 工资 ) 

其 中 加 教师 基本 信息 视图 中 包含 普通 办 公 人 员 可 以 查询 的 教师 基本 信息 ,四 教师 综合 
信息 视图 中 包含 人 事 部 门 可 以 查询 的 教师 信息 ,@ 教 师 工资 信息 包含 财务 部 门 可 以 查询 的 


教师 信息 。 这 样 就 可 以 防止 用 户 非法 访问 不 允许 其 查询 的 数据 ,从 而 在 一 定 程度 上 保证 了 
数据 的 安全 性 。 

3. 简化 用 户 对 系统 的 使 用 步 归 

实际 应 用 系统 中 经 常 要 使 用 某 些 很 复杂 的 查询 ,这些 查询 包括 多 表 连 接 、 限 制 分 组 及 
统计 等 。 利 用 子 模式 可 以 简化 查询 步骤 ,为 了 方便 用 户 , 可 以 将 这 些 复 杂 查 询 定 义 为 视图 ， 
用 户 每 次 只 对 定义 好 的 视图 进行 查询 ,从 而 避免 每 次 查询 对 其 进行 重复 描述 ,大 大 简化 了 用 
户 对 系统 的 使 用 步骤 。 


5.5 物理 结构 设计 


数据 库 的 物理 结构 指 的 是 数据 库 在 物理 设备 上 的 存储 结构 与 存 取 方 法 , 它 依 赖 于 给 定 
的 数据 库 管 理 系统 。 数 据 库 的 物理 结构 设计 是 指 对 于 给 定 的 逻辑 数据 模型 选取 一 个 最 适合 
应 用 环境 的 物理 结构 。 
由 于 不 同 的 数据 库 产品 所 提供 的 物理 环境 、 存 取 方法 和 存储 结构 各 不 相同 , 供 设计 人 员 
使 用 的 设计 变量 参数 范围 也 各 不 相同 ,所 以 数据 库 的 物理 结构 设计 没有 通用 的 设计 方法 可 
以 遵循 , 仅 有 一 般 的 设计 内 容 和 设计 原则 供 数 据 库 设计 人 员 参 考 。 数 据 库 设计 人 员 都 希望 
自己 设计 的 数据 库 物 理 结 构 能 满足 事务 在 数据 库 上 运行 时 的 各 项 要 求 , 如 响应 时 间 少 、 存 储 
空间 利用 率 高 和 事务 吞吐 率 大 等 。 因 此 设计 人 员 应 该 详细 地 分 析 将 要 运行 的 事务 ,获取 数 
据 库 物理 设计 所 需要 的 参数 ,并 且 应 当 全 面 了 解 给 定 的 DBMS 的 功能 、 提 供 的 物理 环境 和 
工具 ,尤其 是 存储 结构 和 存 取 方 法 。 

数据 库 的 物理 结构 设计 一 般 分 为 两 步 : 

(1) 确定 数据 库 的 物理 结构 。 

(2) 评价 物理 结构 。 

其 中 ,确定 数据 库 的 物理 结构 ,在 关系 数据 库 中 主要 指 存 取 方 法 和 存储 结构 ; 评价 物理 
结构 ,评价 的 重点 是 时 间 和 空间 效率 。 


5.5.1 确定 数据 库 的 物理 结构 


关系 数据 库 物 理 结构 设计 的 内 容 , 主 要 包括 为 关系 模式 选择 存 取 方 法 ,以 及 确定 关系 、 
索引 等 数据 库 文件 的 物理 存储 结构 , 即 形 成 数据 库 的 内 模式 。 

1. 关系 模式 存 取 方 法 的 选择 

设计 人 员 在 为 关系 模式 选择 存 取 方法 时 ,首先 应 该 对 将 要 运行 的 事务 进行 详细 分 析 , 获 
得 所 需要 的 信息 及 参数 ,主要 包括 三 个 方面 。 

(1) 数据 库 查 询 事务 需要 获取 的 信息 

@ 查询 所 涉及 的 关系 。 

@ 查询 条 件 所 涉及 的 属性 。 

@ 连接 条 件 所 涉及 的 属性 。 

@ 查询 列表 中 涉及 的 属性 。 
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(2) 数据 库 更 新 事务 需要 获取 的 信息 

@ 更 新 所 涉及 的 关系 。 

@ 每 个 关系 上 的 更 新 条 件 所 涉及 的 属性 。 

@ 更 新 操作 所 涉及 的 属性 。 

(3) 每 个 事务 在 各 关系 上 运行 的 频率 和 性 能 要 求 

以 上 这 些 事务 信息 对 于 关系 模式 存 取 方法 的 选择 都 有 直接 影响 ,是 选择 存 取 方法 的 依 
据 。 数 据 库 上 运行 的 事务 会 不 断 变 化 ,数据 库 运行 后 需要 根据 事务 信息 的 变化 调整 数据 库 
的 物理 结构 。 

存 取 方 法 是 快速 存 取 数据 库 中 数据 的 技术 ,数据 库 管 理 系 统一 般 提供 多 种 存 取 方法 。 
物理 结构 设计 的 任务 之 一 是 根据 关系 数据 库 管理 系统 支持 的 存 取 方法 确定 选择 哪些 存 取 
方法 。 

常用 的 存 取 方法 为 索引 (indexing) 方 法 和 聚 徐 (clustering) 方 法 。 

(1) 索引 存 取 方 法 的 选择 

为 关系 模式 选择 索引 存 取 方 法 ,实际 上 就 是 根据 应 用 要 求 确定 对 关系 的 哪些 属性 建立 
索引 ,哪些 属性 建立 组 合 索 引 , 哪 些 索 引 建立 唯一 索引 等 。 建 立 索 引 的 基本 原则 如 下 。 

@ 如 果 某 个 (或 某 些 ) 属 性 经 常 在 查询 条 件 中 出 现 , 则 考虑 在 这 个 (或 这 些 ) 属 性 上 建立 
索引 (或 组 合 索引 ) 。 

@ 如 果 某 个 (或 某 些 ) 属 性 经 常 在 连接 操作 的 连接 条 件 中 出 现 , 则 考虑 在 这 个 (或 这 些 ) 
属性 上 建立 索引 (或 组 合 索引 ) 。 

@ 如 果 某 个 属性 经 常 作为 分 组 的 依据 列 , 则 考虑 在 这 个 属性 上 建立 索引 。 

由 于 系统 为 维护 索引 及 查找 索引 都 要 付出 代价 ,因此 在 关系 模式 上 建立 的 索引 数 并 不 
是 越 多 越 好 。 例 如 ,在 更 新 频率 很 高 的 关系 上 定义 的 索引 ,数量 就 不 能 太 多 。 因 为 更 新 一 个 
关系 时 ,必须 对 这 个 关系 上 有 关 的 索引 作 相 应 的 修改 。 总 之 ,在 为 数据 库 中 的 关系 建立 索引 
时 ,应 权衡 数据 操作 的 类 型 。 如 果 查 询 多 ,并 且 对 查询 的 性 能 要 求 较 高 , 则 应 考虑 多 建 一 些 
索引 ; 如 果 数 据 更 新 多 ,并 且 对 更 改 的 效率 要 求 较 高 , 则 应 考虑 少 建 一 些 索引 。 

(2) 聚 侯 存 取 方 法 的 选择 

在 一 个 关系 模式 中 ,为 了 提高 某 个 属性 或 属性 组 的 查询 速度 ,把 这 个 属性 或 属性 组 上 具 
有 相同 值 的 元 组 集中 存放 在 连续 的 物理 块 上 的 处 理 称 为 聚 簇 ,这 个 属性 或 属性 组 称 为 聚 
簇 码 。 

聚 侯 功能 同样 适用 于 经 常 进行 连接 操作 的 多 个 关系 , 即 把 多 个 具有 连接 关系 的 元 组 按 
连接 属性 值 聚 集 存放 ,连接 属性 成 为 聚 簇 码 ,可 以 大 大 提高 连接 操作 的 效率 。 

一 个 数据 库 可 以 建立 多 个 聚 簇 ,但 一 个 关系 模式 只 能 加 入 一 个 聚 簇 。 选 择 聚 侯 存 取 方 
法 就 是 确定 需要 建立 多 少 个 聚 簇 ,确定 每 个 聚 簇 中 包括 哪些 关系 。 

聚 簇 设计 可 分 两 步 进行 : 首先 根据 规则 确定 候选 聚 簇 ,然后 从 候选 聚 簇 中 去 除 不 必要 
的 关系 。 

设计 候选 聚焦 的 原则 如 下 。 

O@ 对 经 常 进行 连接 操作 的 关系 可 以 建立 聚 簇 。 

@ 如 果 某 个 关系 的 一 组 属性 经 常 出 现在 相等 、 比 较 条 件 中 , 则 该 单个 关系 可 建立 聚 簇 。 

@ 如 果 某 个 关系 的 一 个 (或 一 组 ) 属 性 上 的 值 重 复 率 很 高 , 则 此 单个 关系 可 建立 聚 簇 。 


即 对 应 每 个 聚 簇 码 值 的 平均 元 组 数 不 能 太 少 , 太 少 则 涌 簇 的 效果 不 明显 。 

检查 候选 聚焦 中 的 关系 ,取消 其 中 不 必要 的 关系 ,主要 方法 分 为 以 下 几 种 。 

O@ 从 聚焦 中 删除 经 常 进行 全 表 扫 描 的 关系 。 

@ 从 聚焦 中 删除 更 新 操作 远 多 于 连接 操作 的 关系 。 

@ 不 同 的 聚 簇 中 可 能 包含 相同 的 关系 ,一 个 关系 可 以 在 某 一 个 聚 簇 中 ,但 不 能 同时 加 
入 多 个 聚 艇 。 应 从 多 个 聚 簇 方案 (包括 不 建立 聚 答 ) 中 选择 一 个 较 优 的 方案 , 即 在 这 个 聚 簇 
上 运行 各 种 事务 的 总 代价 最 小 的 方案 。 

建立 聚 艇 时 应 注意 以 下 三 个 问题 。 

O@ 聚 簇 虽然 提高 了 某 些 应 用 的 性 能 ,但 是 建立 与 维护 聚 簇 的 代价 较 大 。 

@ 对 已 有 的 关系 建立 聚 信 ,将 导致 关系 中 的 元 组 移动 其 物理 存储 位 置 , 这 样 会 使 关系 
上 原 有 的 索引 无 效 , 要 想 使 用 原 索 引 就 必须 重建 原 有 索引 。 

@@ 当 一 个 元 组 的 聚 簇 码 值 改 变 时 ,该 元 组 的 存储 位 置 也 要 做 相应 移动 ,所 以 聚 簇 码 值 
应 当 相 对 稳定 ,以 减少 修改 聚 复 码 值 所 引起 的 维护 代价 。 

综合 以 上 因素 ,一 个 关系 是 否 选择 聚 簇 存 取 方法 应 根据 实际 情况 综合 分 析 确 定 。 

2. 数据 库 文 件 存 取 结构 的 确定 

关系 数据 库 物 理 结构 的 设计 除了 选择 关系 模式 的 存 取 方法 ,还 包括 确定 关系 、 索 引 、 聚 
往日 志 及 备份 等 数据 库 文件 的 存放 安排 和 存储 结构 ,确定 系统 配置 等 。 确 定数 据 的 存放 位 
置 和 存储 结构 要 综合 考虑 存 取 时 间 ,存储 空间 利用 率 和 维护 代价 三 方面 的 因素 ,需要 综合 考 
虑 ,以 选择 合理 的 方案 。 

(1) 确定 数据 的 存放 位 置 

为 了 提高 系统 性 能 ,应 该 根据 应 用 情况 将 数据 的 易 变 部 分 与 稳定 部 分 、 经 常 存 取 部 分 和 
存 取 频 率 较 低 部 分 分 开 存放 。 对 于 有 多 个 磁盘 的 计算 机 ,可 以 采用 下 面 几 种 存 取 位 置 的 分 
配方 案 。 

O 将 表 和 索引 放 在 不 同 的 磁盘 上 ,这样 在 查询 时 ,由 于 两 个 磁盘 驱动 器 并 行 工作 ,可 以 
提高 物理 IO 读 写 的 效率 。 

@ 将 比较 大 的 表 分 别 放 在 两 个 磁盘 上 ,以 加 快 存 取 速 度 , 这 在 多 用 户 环境 下 特别 有 效 。 

@ 将 日 志文 件 、 备 份 文件 与 数据 库 对 象 ( 表 、 索 引 等 ) 放 在 不 同 的 磁盘 上 以 改进 系统 的 
性 能 。 

@ 对 于 经 常 存 取 或 存 取 时 间 要 求 高 的 对 象 (如 表 、 索 引 ) 应 放 在 高 速 存 储 器 (如 硬盘 ) 
上 ,对 于 存 取 频 率 小 或 存 取 时 间 要 求 低 的 对 象 (如 数据 库 的 数据 备份 和 日 志文 件 备份 等 只 在 
故障 恢复 时 才 使 用 ) ,如 果 数 据 量 很 大 ,可 以 存放 在 低速 存储 设备 上 。 

由 于 各 个 系统 所 能 提供 的 对 数据 进行 物理 安排 的 手段 .方法 差异 很 大 ,因此 设计 人 员 应 
仔细 了 解 给 定 的 DMBS 提供 的 方法 和 参数 ,针对 具体 应 用 环境 的 要 求 , 对 数据 进行 适当 的 
物理 安排 。 

(2) 确定 系统 配置 

在 数据 库 物 理 设 计 阶 段 ,设计 人 员 需 要 确定 系统 配置 参数 。DBMS 产品 一 般 都 提供 了 
一 些 系统 配置 变量 和 存储 分 配 参 数 , 供 设计 人 员 对 数据 库 进 行 物理 优化 。 在 初始 状态 下 ， 
DBMS 为 这 些 变量 赋予 了 合理 的 默认 值 , 但 是 这 些 默 认 值 不 一 定 适合 每 一 种 应 用 环境 ,在 
进行 数据 库 的 物理 设计 时 还 需要 根据 应 用 需求 重新 对 这 些 变量 赋值 ,以 改善 系统 的 性 能 。 


乾 据 亩 设计 


地 on 由 


数据 库 原 理 及 应 用 教程 一 -SQL Server 2014 


系统 配置 变量 很 多 ,例如 : 同时 使 用 数据 库 的 用 户 数 ,同时 打开 的 数据 库 对 象 数 ,内 存 
分 配 参数 ,缓冲 区 分 配 参数 (使 用 的 缓冲 区 长 度 , 个 数 ) ,存储 分 配 参数 ,物理 块 的 大 小 ,物理 
块 装填 因子 ,时 间 片 大 小 ,数据 库 的 大 小 及 锁 的 数目 等 ,这 些 参 数值 对 存 取 时 间 和 存储 空间 
的 分 配 都 有 影响 ,物理 设计 时 需要 根据 应 用 环境 确定 这 些 参数 值 ,以 优化 系统 的 性 能 。 在 物 
理 设计 阶段 对 这 些 系 统 配置 变量 调整 后 ,在 数据 库 运行 阶段 还 要 根据 实际 运行 情况 做 进 一 
步 的 参数 调整 ,以 改进 系统 的 性 能 。 


5.5.2 评价 物理 结构 


物理 结构 设计 过 程 中 需要 权衡 时 间 效 率 、 空 间 效 率 ,、 维 护 代价 和 各 种 用 户 要 求 等 多 种 因 
素 , 因 此 会 产生 多 种 设计 方案 ,数据 库 设 计 人 员 应 该 对 这 些 方案 进行 全 面 细致 的 评价 ,从 中 
选择 一 个 较 优 的 方案 作为 数据 库 的 物理 结构 。 

对 物理 结构 设计 方案 的 评价 方法 完全 依赖 于 具体 的 关系 数据 库 管理 系统 。 首 先 需 要 定 
量 估算 各 种 方案 的 存储 空间 、 存 取 时 间 和 维护 代价 ,然后 对 估算 结果 进行 比较 和 权衡 ,选择 
出 一 个 合理 可 行 的 物理 结构 方案 。 具 体 需要 考虑 的 量化 指标 主要 有 如 下 几 类 。 

(1) 查询 和 响应 时 间 。 响 应 时 间 是 从 查询 开始 到 查询 结果 显示 之 间 所 需要 的 时 间 。 一 
个 完好 的 应 用 程序 设计 可 以 减少 CUP 时 间 和 1I/O 时 间 。 

(2) 更 新 事务 的 时 间 。 主 要 是 修改 索引 、 重 写 物理 块 或 文件 以 及 写 校 验 码 等 方面 的 时 
间 需 求 量 。 

(3) 生成 报告 的 时 间 。 主 要 包括 索引 、` 重 组 排序 和 结果 显示 的 时 间 需 求 量 。 

(4) 主 存储 空间 的 需求 量 。 包 括 程序 和 数据 所 占用 的 空间 。 对 数据 库 设 计 者 来 说 ,一 
般 可 以 对 缓冲 区 做 适当 的 控制 ,如 缓冲 区 个 数 和 大 小 。 

(5) 辅助 存储 空间 的 需求 量 。 辅 助 存储 空间 分 为 数据 块 和 索引 块 两 种 ,设计 人 员 可 以 
控制 索引 块 的 大 小 、 索 引 块 的 充满 度 等 。 

在 具体 实施 过 程 中 ,数据 库 设 计 人 员 只 能 对 I/O 和 辅助 空间 进行 有 效 控制 。 其 他 方面 
只 能 是 有 限 的 控制 或 者 根本 就 不 能 控制 。 如 果 评 价 结果 满足 原 设计 的 要 求 , 则 可 以 进入 数 
据 库 实施 阶段 ,否则 应 该 重新 设计 或 修改 物理 结构 ,甚至 可 能 要 返回 逻辑 设计 阶段 修改 数据 
模型 。 


5.6 数据 库 的 实施 和 维护 


依据 数据 库 设 计 的 步骤 ,数据 库 物 理 结构 设计 完成 后 , 即 可 进入 数据 库 实 施 阶段 ,数据 
库 实施 后 试 运行 结果 满意 , 即 可 进入 数据 库 运行 与 维护 阶段 。 


5.6.1 数据 库 实施 


数据 库 实 施 是 指 根据 逻辑 设计 和 物理 设计 的 结果 ,在 计算 机 上 建立 实际 的 数据 库 结 构 、 
加 载 数据 、 进 行 测试 和 试 运行 的 过 程 。 数 据 库 实施 主要 包括 加 载 数据 、 应 用 程序 调试 和 数据 
库 试 运行 等 工作 。 

1. 加 载 数据 和 应 用 程序 调试 

向 数据 库 中 装 和 人 数据 又 称 为 数据 库 加 载 (Loading) ,是 数据 库 实施 阶段 的 主要 工作 。 在 


数据 库 加 载 前 ,首先 根据 逻辑 设计 和 物理 设计 的 结果 ,在 计算 机 上 建立 实际 的 数据 库 结构 ; 
在 数据 库 结 构建 好 之 后 ,就 可 以 向 数据 库 中 加 载 数 据 了 。 

实际 数据 库 应 用 系统 中 的 原始 数据 量 一 般 都 很 大 ,来 源 于 一 个 企业 (或 组 织 ) 中 各 个 部 
门 的 数据 文件 .报表 或 多 种 形式 的 单据 ,存在 着 许多 交叉 重复 现象 ,并 且 数 据 的 组 织 方式 、 格 
式 和 结构 一 般 都 不 符合 数据 库 系 统 的 要 求 。 必 须 把 这 些 数据 从 各 个 局 部 应 用 中 抽取 出 来 ， 
汇总 整理 ,去 掉 宛 余 , 并 转换 成 符合 数据 库 中 数据 结构 的 形式 ,这 样 处 理 之 后 才能 装 人 数据 
库 。 因 此 ,数据 入 库 之 前 的 处 理工 作 需 要 耗费 大 量 的 人 力 、 物 力 , 是 一 种 非常 单调 乏味 而 又 
非常 重要 的 工作 。 特 别 是 原来 用 手工 处 理 数据 的 系统 ,各 类 数据 分 散在 各 种 不 同 的 原始 表 
单 、 赁 据 和 单据 之 中 。 在 向 新 的 数据 库 系统 中 输入 数据 时 ,需要 处 理 大量 的 纸 质数 据 , 工 作 
量 就 更 大 了 。 

对 于 一 个 具体 的 数据 库 应 用 系统 ,在 数据 库 实施 阶段 ,为 了 提高 数据 输入 工作 的 效率 和 
质量 ,应 该 针对 具体 的 应 用 环境 设计 一 个 数据 录入 子 系统 ,用 来 解决 数据 转换 和 输入 问题 。 
为 了 保证 数据 库 中 的 数据 正确 ,必须 十 分 重视 数据 的 校 验 工作 。 在 数据 入 库 前 应 该 采用 多 
种 方法 对 数据 进行 多 次 校 验 。 对 于 重要 数据 的 校 验 更 应 该 反复 进行 ,确认 无 误 后 再 输入 到 
数据 库 中 。 

目前 ,很 多 DBMS 都 提供 了 数据 导入 的 功能 ,有 些 DBMS 还 提供 了 功能 强大 的 不 同系 
统 之 间 的 数据 转换 功能 。 比 如 SQL Server 就 提供 了 功能 强大 方便 易 用 的 数据 导入 和 导出 
功能 。 

5. 1 节 已 论述 了 数据 库 设 计 的 特点 之 一 ,是 数据 库 结 构 设 计 与 数据 库 应 用 系统 的 程序 
设计 应 相互 结合 同时 进行 ,因此 在 组 织 数据 入 库 的 同时 还 要 调试 系统 的 应 用 程序 。 应 用 程 
序 的 设计 及 编码 .调试 程序 的 方法 及 步骤 在 软件 工程 等 课程 中 有 详细 讲解 ,本 书 第 10 章 通 
过 一 个 完整 的 应 用 实例 ,论述 了 数据 库 应 用 系统 的 程序 设计 与 数据 库 设 计 相 结合 的 开发 

2. 数据 库 的 试 运行 

数据 库 实 施 过 程 中 ,各 类 数据 有 一 小 部 分 加 载 入 库 后 ,并 且 应 用 程序 的 功能 调试 已 初步 
完成 ,就 可 以 开始 对 数据 库 系 统 进行 联合 调试 了 ,这 称 为 数据 库 的 试 运行 。 试 运行 期 间 主 要 
完成 两 方面 的 工作 。 

(1) 功能 测试 

实际 运行 数据 库 应 用 程序 ,执行 对 数据 库 的 各 种 操作 ,测试 应 用 程序 的 功能 是 否 满足 设 
计 要 求 。 如 果 应 用 程序 的 功能 不 能 满足 设计 要 求 , 则 需要 对 应 用 程序 进行 修改 及 调整 ,直到 
达到 设计 要 求 为 止 。 

(2) 性 能 测试 

测试 系统 的 性 能 指标 ,分 析 其 是 否 符合 设计 目标 ,由 于 对 数据 库 进行 物理 设计 时 考虑 的 
性 能 指标 是 近似 的 估计 ,与 实际 系统 运行 产生 的 指标 有 一 定 的 差距 ,因此 必须 在 试 运行 阶段 
实际 测量 和 评价 系统 性 能 指标 。 如 果 测 试 的 结果 与 设计 目标 不 符 , 则 要 返回 物理 设计 阶段 ， 
重新 调整 物理 结构 ,修改 系统 参数 , 某 些 情 况 下 甚至 要 返回 逻辑 设计 阶段 ,修改 迎 辑 结构 。 

数据 库 试 运行 期 间 注 意 两 点 。 

(1) 数据 库 的 试 运行 操作 应 分 步 进行 ,前 面 已 经 讲 到 组 织 数 据 入 库 是 十 分 繁杂 、 费 时 费 
力 的 事 , 如 果 试 运行 后 还 需要 修改 数据 库 的 设计 ,就 会 导致 数据 的 重新 人 库 , 因 此 应 分 期 分 | 章 
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批 地 组 织 数据 入 库 ,首先 输入 小 批量 数据 做 调试 用 ,在 试 运行 结束 基本 合格 后 ,再 大 批量 输 
入 数据 ,逐步 增加 数据 量 ,逐步 完成 运行 指标 的 评价 。 

(2) 数据 库 的 实施 和 调试 是 不 可 能 一 次 完成 的 ,在 数据 库 试 运行 阶段 ,由 于 系统 和 运行 还 
不 稳定 ,随时 可 能 发 生 软 件 故障 。 同 时 ,由 于 系统 的 操作 人 员 对 新 系统 还 不 够 熟悉 ,也 可 能 
发 生 误 操 作 。 因 此 ,在 数据 库 试 运行 时 ,应 首先 调试 运行 数据 库 的 转 储 和 恢复 功能 ,如 果 发 
生 故 障 ,能 够 尽快 恢复 数据 库 中 数据 ,尽量 减少 对 数据 库 的 破坏 。 


5.6.2 数据 库 的 运行 和 维护 


数据 库 实施 后 车 系统 试 运行 结果 满意 , 则 数据 库 就 可 以 投入 正式 运行 了 , 即 进 入 数据 库 
运行 与 维护 阶段 。 数 据 库 投入 运行 标志 着 开发 工作 的 基本 完成 和 维护 工作 的 开始 ,在 此 阶 
段 ,需要 不 断 地 对 数据 库 进行 评价 .调整 和 维护 。 

在 数据 库 运行 与 维护 阶段 ,对 数据 库 的 日 常 维护 主要 由 数据 库 管理 员 (DBA) 完 成 ,其 
主要 工作 包括 以 下 四 个 方面 。 

1. 数据 库 的 转 储 和 恢复 

数据 库 的 转 储 和 恢复 是 系统 正式 运行 后 最 重要 的 维护 工作 之 一 。 需 要 DBA 针对 不 同 
的 应 用 要 求 制定 不 同 的 转 储 计 划 ,以 保证 一 旦 发 生 故 障 能 够 利用 备份 文件 尽快 将 数据 库 恢 
复 到 某 种 一 致 的 状态 ,使 数据 库 被 破坏 程度 降 为 最 低 , 以 保证 数据 库 系统 的 正常 运行 。 

2. 数据 库 的 安全 性 和 完整 性 控制 

随 着 数据 库 应 用 环境 的 变化 ,对 数据 库 的 安全 性 和 完整 性 要 求 也 会 发 生变 化 。 比 如 ,要 
增加 或 修改 某 些 用 户 的 权限 ,增加 或 删除 用 户 ,或 者 某 些 数据 的 取 值 范围 发 生变 化 等 ,都 需 
要 DBA 对 数据 库 中 相应 的 部 分 进行 适当 的 调整 ,以 反映 这 些 新 的 变化 ,实现 对 数据 库 的 安 
全 性 与 完整 性 的 控制 。 

3. 数据 库 性 能 的 监督 分 析 和 改造 

在 数据 库 运行 过 程 中 ,DBA 的 另 一 项 重要 任务 是 监督 系统 运行 ,对 监测 数据 进行 分 析 
并 找 出 改进 系统 性 能 的 方法 。 目 前 有 些 DBMS 产品 提供 了 监测 系统 性 能 的 参数 工具 ,DBA 
可 以 利用 这 些 工具 方便 地 监测 系统 运行 的 性 能 参数 ,判断 系统 运行 状况 ,并 确定 如 何 改进 。 

4. 数据 库 的 重组 织 与 重 构造 

数据 库 正 式 运行 后 , 随 着 数据 的 不 断 增加 、 删 除 和 修改 ,数据 库 的 存 取 效率 会 逐步 降低 ， 
这 就 要 求 DBA 改变 数据 库 数 据 的 组 织 方式 ,通过 增加 、 删 除 或 调整 部 分 索引 等 方法 ,改善 
系统 的 性 能 。 数 据 库 的 重组 织 并 不 改变 原 数据 库 设计 的 逻辑 结构 与 物理 结构 。 

数据 库 应 用 环境 的 变化 可 能 导致 数据 库 的 逻辑 结构 发 生变 化 ,例如 ,需要 增加 新 的 实 
体 ,增加 某 些 实体 的 属性 ,或 实体 之 间 的 联系 发 生 了 变化 ,这 样 使 原 有 的 数据 库 设 计 不 能 满 
足 新 的 要 求 ,必须 对 原来 的 数据 库 进 行 重新 构造 ,适当 调整 数据 库 的 模式 和 内 模式 ,例如 , 增 
加 新 的 数据 项 ,增加 或 删除 索引 ,修改 完整 性 约 东 条 件 等 。 数 据 库 的 重 构 造 需要 部 分 修改 原 
数据 库 的 模式 和 内 模式 。 

DBMS 一 般 都 提供 了 重新 组 织 和 构造 数据 库 的 应 用 程序 ,以 帮助 DBA 完成 数据 库 的 
重组 和 重 构 工作 。 

只 要 数据 库 系统 在 运行 ,就 需要 不 断 地 进行 修改 、 调 整 和 维护 。 一 旦 应 用 变化 太 大 , 数 
据 库 重组 织 和 重 构 造 都 解决 不 了 ,就 表明 数据 库 应 用 系统 的 生命 周期 结束 了 ,应 该 重新 设 


计 、 建 立新 的 数据 库 系统 ,同时 标志 着 一 个 新 的 数据 库 应 用 系统 生命 周期 的 开始 。 


5.7 小 结 


本 章 主要 讨论 基于 关系 数据 库 管理 系统 的 关系 数据 库 设 计 问题 。 数 据 库 设计 的 基本 步 
又 大 致 分 为 六 个 阶段 : 需求 分 析 、 概 念 结构 设计 、 逻 辑 结 构 设 计 、 物 理 结构 设 计 、 数 据 库 实 
施 .数据 库 运行 与 维护 。 本 章 详细 讨论 了 每 一 设计 阶段 的 任务 ,方法 和 步骤 。 重 点 论述 了 概 
念 结构 设计 和 逻辑 结构 设计 的 方法 和 步骤 ,这 是 数据 库 设 计 过 程 中 最 重要 的 两 个 环节 。 本 
章 以 高 校 教学 信息 管理 系统 为 例 讨论 了 数据 库 设 计 各 阶段 的 设计 方法 和 步 又 。 

需求 分 析 是 整个 数据 库 设 计 过 程 的 基础 ,数据 库 设计 人 员 ( 系 统 分 析 员 ) 和 用 户 双方 共 
同 收集 与 分 析 数 据 库 所 需要 的 信息 ,准确 了 解 用户 对 系统 的 需求 , 弄 清 系统 的 目标 和 将 要 实 
现 的 功能 ,并 以 需求 规格 说 明 书 的 形式 确定 下 来 ,作为 数据 库 系 统 开 发 和 验证 的 依据 。 

概念 结构 设计 是 数据 库 设计 人 员 对 需求 分 析 阶 段 获得 的 用 户 需求 进行 综合 .归纳 与 抽 
象 ,形成 反映 应 用 系统 信息 需求 的 数据 库 概 念 结构 , 即 概念 模型 (E-R 模型 ) 。 这 一 阶段 主要 
介绍 了 采用 自 底 向 上 的 策略 设计 概念 结构 的 两 个 步骤 : 第 一 步 是 抽象 数据 并 设计 局 部 概念 
结构 ; 第 二 步 是 集成 局 部 概念 结构 ,得 到 全 局 概念 结构 。 概 念 模型 独立 于 计算 机 的 硬件 , 独 
立 于 支持 数据 库 的 DBMS 。 

逻辑 结构 设计 的 任务 是 将 概念 模型 转换 为 与 选用 的 DBMS 所 支持 的 数据 模型 相符 合 
的 迎 辑 结构 。 目 前 的 数据 库 应 用 系统 大 都 采用 支持 关系 数据 模型 的 关系 数据 库 管 理 系统 ， 
这 一 阶段 主要 讨论 了 关系 数据 库 的 逻辑 结构 设计 问题 ,详细 介绍 了 E-R 模型 向 关系 模型 的 
转换 、 关 系 模型 的 优化 及 用 户 子 模 式 的 设计 。 

物理 结构 设计 就 是 为 给 定 的 逻辑 模型 选取 一 个 适合 应 用 环境 的 物理 结构 ,物理 结构 设 
计 包 括 确定 物理 结构 和 评价 物理 结构 两 部 分 。 这 一 阶段 介绍 了 关系 数据 库 物 理 结 构 设计 的 
内 容 ,主要 包括 为 关系 模式 选择 存 取 方法 ,以 及 确定 关系 .索引 等 数据 库 文件 的 物理 存储 结 
构 , 即 形成 数据 库 的 内 模式 。 

数据 库 实 施 阶段 的 任务 ,是 根据 逻辑 设计 和 物理 设计 的 结果 ,在 计算 机 上 建立 起 实际 的 
数据 库 结 构 ,加 载 数据 并 试 运行 整个 数据 库 应 用 系统 。 

数据 库 的 运行 与 维护 是 数据 库 设计 的 最 后 阶段 。 对 数据 库 的 日 常 维护 主要 由 数据 库 管 
理 员 (DBA) 完 成 ,这 一 阶段 介绍 了 DBA 维护 工作 的 主要 内 容 : 数据 库 的 转 储 和 恢复 ,数据 
库 的 安全 性 和 完整 性 控制 ,数据 库 性 能 的 监督 ,分 析 和 改造 ,数据 库 的 重组 织 与 重 构造 。 只 
要 数据 库 系统 在 运行 ,就 需要 不 断 地 对 其 进行 修改 、 调 整 和 维护 。 

学 习 本 章 应 努力 掌握 书 中 讨论 的 每 个 设计 阶段 的 基本 方法 ,学 会 在 实际 应 用 系统 中 设 
计 符 合 应 用 需求 的 概念 结构 、 巡 辑 结构 及 物理 结构 ,构建 数据 库 的 模式 、 外 模式 及 内 模式 ,将 
数据 库 设 计 与 应 用 系统 程序 设计 结合 起 来 ,形成 满足 用 户 需求 的 数据 库 应 用 系统 。 


习 题 


1. 简 述 数据 库 设计 的 特点 。 
2. 简 述 数据 库 设计 的 基本 步骤 。 


雪 据 亩 设计 
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. 试 述 数据 库 设 计 过 程 中 形成 的 数据 库 三 级 模式 。 
. 简 述 需求 分 析 阶 段 的 任务 。 
. 数据 字典 的 内 容 和 作用 是 什么 ? 
. 数据 库 概念 结构 设计 的 策略 是 什么 ? 
. 简 述 数据 库 的 逻辑 结构 设计 步骤 。 
. 把 E-R 模型 转换 为 关系 模式 的 转换 规则 有 哪些 ? 
. 数据 模型 的 优化 包含 哪些 方法 ? 

10. 简 述 数据 库 物 理 结构 设计 的 内 容 和 步骤 。 

11. 简 述 数据 库 实施 阶段 的 主要 任务 。 数 据 输入 在 实施 阶段 的 重要 性 是 什么 ? 

12. 什么 是 数据 库 的 重组 织 和 重 构 造 ? 为 什么 要 进行 数据 库 的 重组 织 和 重 构造 ? 

13. 设 某 商 场 有 商业 销售 记 账 数据 库 。 一 个 顾客 (顾客 姓名 ,单位 ,电话 号 码 ) 可 以 买 多 
种 商品 ,一 种 商品 (商品 名 称 , 型 号 ,单价 ) 供 应 多 个 顾客 。 试 画 出 对 应 的 ER 图 。 

14. 某 工 厂 生产 若干 产品 ,每 种 产品 由 不 同 的 零件 组 成 ,每 种 零件 可 用 在 不 同 的 产品 
上 。 这 些 零件 由 不 同 的 原材料 制 成 ,不 同 零件 所 用 的 材料 可 以 相同 。 这 些 零 件 按 所 属 的 不 
同 产品 分 别 放 在 仓库 中 ,原材料 按照 类 别 放 在 若干 仓库 中 。 请 画 出 E-R 图 描述 此 工厂 产 
品 、 零 件 、 材 料 、 仓 库 的 概念 模型 。 

15. 假定 一 个 部 门 的 数据 库 包 括 以 下 的 信息 : 

。 职工 的 信息 : 职工 号 、 姓 名、 住址 和 所 在 部 门 。 

。 部 门 的 信息 : 部 门 所 有 职工 \ 经 理 和 销售 的 产品 。 

。 产品 的 信息 : 产品 名 ,制造 商 , 价 格 、 型 号 及 产品 内 部 编号 。 

。 制造 商 的 信息 : 制造 商 名 称 、 地 址 、 生 产 的 产品 名 称 、 价 格 。 

试 画 出 描述 这 个 数据 库 概 念 结构 的 E-R 图 。 

16. 将 图 5-23 所 示 的 E-R 图 转换 为 关系 模型 。 


[单位 号 地 址 [电话 


oN 人 w 


[职工 号 姓名 性 别 年 瞪 | [单位 号 


5-23 单位 拥有 职工 的 ER 


17. 将 图 5-24 所 示 的 E-R 图 转换 为 符合 3NF 的 关系 模式 ,并 指出 每 个 关系 模式 的 主 
码 和 外 码 。 
18. 某 医院 病房 计算 机 管理 中 需要 如 下 信息 : 


科室 信息 : 科 名 , 科 地 址 , 科 电 话 ,医生 姓名 

病房 信息 : 病房 号 ,床位 号 ,所 属 科 室 名 

医生 信息 : 姓名 ,职称 ,所 属 科室 名 ,年 龄 ,工作 证 号 

病人 信息 : 病历 号 ,姓名 ,性 别 ,诊断 ,主管 医生 ,病房 号 
其 中 ,一 个 科室 有 多 个 病房 、 多 个 医生 ,一 个 病房 只 能 属于 一 个 科室 ,一 个 医生 只 属于 一 个 科 
室 , 但 可 负责 多 个 病人 的 诊治 ,一 个 病人 的 主治 医生 只 有 一 个 。 

试 完成 如 下 设计 : 

(1) 设计 该 医院 病房 计算 机 管理 系统 的 E-R 图 ; 

(2) 将 该 E-R 图 转换 为 关系 模型 ; 

(3) 指出 转换 结果 中 每 个 关系 模式 的 候选 码 。 


图 5-24 读者 借阅 图 书 的 E-R 图 
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第 6 章 数据 库 安 全 性 


【本 章 主要 内 容 】 

1. 简要 介绍 计算 机 系统 的 安全 标准 以 及 数据 库 安 全 性 控制 的 常用 方法 。 
2. 重点 阐述 存 取 控制 方法 (DAC 和 MAC) 。 

3. 简单 讨论 了 审计 、 视 图 及 加 密 机 制 在 数据 库 安 全 性 方面 的 作用 。 


计算 机 系统 的 可 靠 性 一 般 是 指 系 统 正 常 地 无 故障 运行 的 概率 。 数 据 库 的 可 靠 性 概念 则 
是 指数 据 库 的 安全 性 (Security) 与 完整 性 (Integrity) 。 

首先 介绍 一 些 有 关 数 据 库 安全 性 与 完整 性 的 专用 名 词 与 基本 概念 。 

数据 库 的 安全 性 是 指 对 数据 库 进行 安全 控制 ,保护 数据 库 以 防止 不 合法 的 使 用 所 造成 
的 数据 泄露 ,更改 或 破坏 。 

数据 库 的 完整 性 是 指数 据 的 正确 性 和 相 容 性 。 即 完整 性 保证 数据 的 准确 和 一 致 ,使 数 
据 库 中 的 数据 在 任何 时 刻 都 是 有 效 的 。 

数据 的 完整 性 与 安全 性 是 数据 库 保护 的 两 个 方面 。 安 全 性 是 防止 用 户 非法 使 用 数据 
库 , 包 括 恶 意 破坏 数据 和 越权 存 取 数 据 。 完 整 性 则 是 防止 合法 用 户 使 用 数据 库 时 向 数据 库 
中 加 入 不 合 语义 的 数据 。 也 就 是 说 ,安全 性 措施 的 防范 对 象 为 非法 用 户 和 非法 操作 ,完整 性 
措施 防范 的 对 象 是 错误 无 效 的 数据 。 

数据 库 的 特点 之 一 是 由 数据 库 管 理 系统 提供 统一 的 数据 保护 功能 来 保证 数据 的 安全 可 
靠 和 正确 有 效 。 数 据 库 的 数据 保护 主要 包括 数据 的 安全 性 和 完整 性 。 本 章 主要 介绍 数据 库 
的 安全 性 ,第 7 章 将 讨论 数据 库 的 完整 性 。 


6.1 数据 库 安 全 性 概述 


安全 性 问题 不 是 数据 库 系 统 所 独 有 的 , 它 和 计算 机 系统 的 安全 性 紧密 相连 、 相 互 支持 。 
所 有 计算 机 系统 都 存在 不 安全 因素 。 数 据 库 是 计算 机 系统 中 大 量 数据 集中 存放 的 场所 , 它 
保存 着 长 期 积累 的 信息 资源 ,而 且 这 些 资源 为 众多 最 终 用 户 所 共享 ,但 数据 共享 必然 带 来 数 
据 库 的 安全 性 问题 。 那 么 如 何 保护 这 些 信息 ,使 之 不 受 来 自 外 部 的 破坏 与 非法 使 用 是 
DBMS 的 重要 任务 。 因 此 ,数据 库 系统 中 的 数据 共享 不 能 是 无 条 件 的 共享 ,而 必须 是 在 
DBMS 统一 严格 的 控制 之 下 ,只 允许 有 合法 使 用 权限 的 用 户 访问 允许 其 存 取 的 数据 。 

数据 库 中 数据 的 安全 保护 是 多 方面 的 ,包括 : 

计算 机 系统 内 部 的 保护 ; 

@ 网 络 中 数据 传输 时 数据 保护 ; 


@ 计算 机 硬件 系统 的 数据 保护 ; 

@@ 操作 系统 中 的 数据 保护 ; 

@@ 数据 库 系统 中 的 数据 保护 ; 

应 用 系统 中 的 数据 保护 ; 

@ 计算 机 系统 外 部 的 保护 ; 

@ 环境 的 保护 : 如 加 强 警 戒 、 防 火 、 防 盗 等 ; 

@ 社会 的 保护 : 如 建立 各 种 法 规制 度 ,进行 安全 教育 等 ; 

@@ 设备 保护 : 如 及 时 进行 设备 检查 、 维 修 以 及 更 新 等 。 

在 这 些 保护 中 ,数据库 系统 中 的 数据 保护 是 至 关 重 要 的 。 数 据 库 的 安全 性 是 衡量 一 个 
数据 库 管 理 系统 优 劣 的 重要 技术 指标 之 一 。 


6.1.1 数据 库 的 不 安全 因素 


对 数据 库 安全 性 产生 威胁 的 主要 因素 来 自 于 以 下 几 方 面 。 

1. 非 授 权 用 户 对 数据 库 的 恶意 存 取 和 破坏 

一 些 黑客 (Hacker) 和 犯罪 分 子 在 用 户 存 取 数 据 库 时 猎取 用 户 名 和 用 户口 令 , 然 后 假冒 
合法 用 户 窃取 、 修 改 甚至 破坏 用 户 数据 ; 或 者 写 一 段 合法 的 程序 绕 过 DBMS 及 权限 机 制 的 
检查 ; 可 以 直接 存 取 、 修 改 或 备份 数据 库 中 的 数据 ; 编写 应 用 程序 执行 非 授 权 操 作 等 。 因 
此 ,必须 阻止 有 损 数据 库 安全 的 非法 操作 ,以 保证 数据 免 受 未 经 授权 的 访问 和 破坏 ,数据 库 
管理 系统 提供 的 安全 措施 主要 包括 用 户 身份 鉴别 、 存 取 控 制 和 视图 等 技术 。 

2. 数据 库 中 重要 或 敏感 的 数据 被 泄露 

再 有 就 是 别有用心 的 人 千方百计 盗窃 数据 库 中 的 重要 数据 ,一 些 机 密 信 息 被 暴露 。 为 
防止 数据 泄露 ,数据 库 管理 系统 提供 的 主要 技术 有 强制 存 取 控制 .数据 加 密 存 储 和 加 密 传 

此 外 ,在 安全 性 要 求 较 高 的 部 门 (如 政府 部 门 、 军 事 部 门 等 ) 提 供 审 计 功 能 ,通过 分 析 审 
计 日 志 , 首 先 可 以 对 潜在 的 威胁 提前 采取 措施 加 以 防范 ; 其 次 也 可 以 对 非 授 权 用 户 的 入侵 
行为 及 信息 破坏 情况 能 够 进行 跟踪 ,防止 对 数据 库 安全 责任 的 否认 。 

3. 安全 环境 的 脆弱 性 

之 前 说 过 ,安全 性 问题 不 是 数据 库 系 统 所 独 有 的 , 它 和 计算 机 系统 的 安全 性 ,包括 计算 
机 的 硬件 ,操作 系统 、 网 络 系统 等 的 安全 性 是 紧密 联系 的 。 所 有 计算 机 系统 都 存在 不 安全 因 
素 。 操 作 系 统 安全 的 脆弱 、 网 络 协议 安全 保障 的 不 足 等 也 会 造成 数据 库 安 全 性 的 破坏 。 因 
此 ,必须 加 强 计算 机 系统 的 安全 性 保证 。 那 么 如 何 才 能 规范 和 指导 安全 计算 机 系统 部 件 的 
生产 ,较为 准确 地 测定 产品 的 安全 性 能 指标 ? 为 此 ,在 计算 机 安全 技术 方面 逐步 发 展 建立 了 
一 套 可 信 (Trusted) 计 算 机 系统 的 概念 和 标准 。 以 下 讨论 计算 机 安全 标准 的 相关 问题 。 


6.1.2 计算 机 系统 安全 性 


计算 机 系统 安全 性 是 指 为 计算 机 系统 建立 和 采取 的 各 种 安全 保护 措施 ,以 保护 计算 机 
系统 中 的 硬件 .软件 及 数据 ,防止 因 偶然 或 恶意 的 原因 使 系统 遭 到 破坏 ,数据 遭 到 更 改 或 泄 
露 等 。 

如 图 6-1 是 一 个 计算 机 系统 的 多 级 安全 模型 ,是 数据 库 安全 保护 的 一 个 存 取 控制 流程 。 
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其 中 的 网 络 安全 控制 是 数据 库 应 用 的 外 部 环境 和 基础 ,是 外 部 人 侵 数 据 库 安全 的 第 一 道 屏 障 。 
网 络 系统 层 的 安全 防范 技术 有 多 种 ,大 致 可 以 分 为 防火 墙 \ 入 侵 检 查 ,数字 签名 与 认证 技术 。 

其 次 ,数据 库 管 理 系统 对 提出 SQL 访问 要 求 的 数据 库 用 户 进 行 身份 鉴别 ,防止 不 可 信 
用 户 使 用 系统 。 

第 三 ,在 SQL 处 理 层 进 行 自 主 存 取 控制 和 强制 存 取 控 制 ,进一步 还 可 以 进行 推理 控制 ; 
为 监控 恶意 访问 ,可 根据 具体 安全 需求 配置 审计 规则 ,对 用 户 访问 行为 和 系统 关键 操作 进行 
审计 ; 通过 设置 简单 人 侵 检测 规则 ,对 异常 用 户 行为 进行 检查 和 处 理 。 

第 四 ,操作 系统 安全 保护 的 相关 控制 (该 部 分 内 容 超 出 本 书 范围 ,有 兴趣 的 同学 可 参考 
相关 书籍 ) 。 

最 后 ,在 数据 存储 层 , 数 据 库 管理 系统 不 仅 存 放 用 户 数据 ,还 存储 与 安全 有 关 的 标记 和 
信息 ( 称 为 安全 数据 ) ,提供 存储 加 密 功能 等 。 

计算 机 系统 安全 性 分 为 三 大 类 : 技术 安全 类 ,管理 安全 类 ,政策 法 律 类 。 本 章 介绍 技术 
安全 类 。 


网 络 安 
全 控制 


图 6-1 计算 机 系统 安全 模型 


6.1.3 安全 标准 


为 降低 进而 消除 对 系统 的 安全 攻击 ,在 计算 机 安全 技术 方面 逐步 建立 了 一 套 可 信 标 准 。 
计算 机 以 及 信息 安全 技术 方面 有 一 系列 的 安全 标准 。 在 目前 各 国 所 引用 或 制定 的 一 系列 安 
全 标准 中 ,最 有 影响 也 是 最 基础 的 当 推 1985 年 美国 国防 部 (Department of Defense, DoD) 
正式 颁布 的 (DoD 可 信 计 算 机 系统 评估 准则 》(Trusted Computer System Evaluation 
Criteria,TCSEC 或 DoD85) ,TCSEC 又 称 为 桔 皮 书 。 制 定 该 标准 的 目的 主要 有 以 下 几 点 。 

(1) 提供 一 种 标准 ,使 用 户 可 以 对 其 计算 机 系统 内 敏感 信息 安全 操作 的 可 信 程 度 作 
评估 。 

(2) 给 计算 机 行业 的 制造 商 提供 一 种 可 循 的 指导 规则 ,使 其 产品 能 够 更 好 地 满足 敏感 
应 用 的 安全 需求 。 

在 TCSEC 推出 后 的 10 年 里 ,不 同 的 国家 都 开始 启动 开发 建立 在 TESEC 概念 上 的 评 
佑 准则 ,如 欧洲 的 信息 技术 安全 评估 准则 (Information Technology Security Evaluation 
Criteria,ITSEC) ,加拿大 的 可 信 计 算 机 产品 评估 准则 (Canadian Trusted Computer Product 
Evaluation Criteria,CTCPEC) .美国 的 信息 技术 安全 联邦 标准 (Federal Criteria, FC) 草 案 
等 。 这 些 准 则 比 TCSEC 更 加 灵活 ,适应 了 IT 技术 的 发 展 。 

为 满足 全 球 IT 市场 互 认 标 准 化 安全 评估 结果 的 需要 ,CTCPEC、FC、TCSEC 和 ITSEC 
的 发 起 组 织 于 1993 年 起 开始 联合 行动 ,解决 原 标准 中 概念 和 技术 上 的 差异 ,将 各 自 独立 的 
准则 集合 成 一 组 单一 的 、 能 被 广泛 使 用 的 IT 安全 准则 ,这 被 称 为 通用 准则 (Common 
Criteria,CC) 项 目 。 项 目 发 起 组 织 的 代表 建立 了 专门 的 委员 会 开发 通用 准则 ,历经 多 次 讨 


论 和 修订 ,CC V2. 1 版 于 1999 年 被 ISO 采用 为 国际 标准 ,2001 年 被 我 国 采用 为 国家 标准 。 

目前 CC 已 经 基本 取代 了 TCSEC ,成 为 评估 信息 产品 安全 性 的 主要 标准 。 

1991 年 4 月 美国 NCSC( 国 家 计算 机 安全 中 心 ) 颁 布 了 《可 信 计 算 机 系统 评估 标准 关于 
可 信和 数据 库 系统 的 解释 》(TCSEC/Trusted Database Interpretation, TCSEC/TDI, 简称 
TDI, 即 紫 皮 书 ) ,将 TESEC 扩展 到 数据 库 管理 系统 。TCSFC/TDI 中 定义 了 数据 库 管理 系 
统 的 设计 与 实现 中 需 满足 和 用 以 进行 安全 性 级 别 评估 的 标准 。 从 4 个 方面 来 描述 安全 性 级 
别 划 分 的 指标 , 即 安全 策略 责任、 保证 和 文档 。 每 个 方面 又 分 为 车 干 项 。 

上 述 一 系列 标准 的 发 展 历史 如 图 6-2 所 示 。 
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图 6-2 信息 安全 标准 的 发 展 简 史 


根据 计算 机 系统 对 各 项 指标 的 支持 情况 ,TCSEC/TDI 标准 中 将 数据 安全 划分 为 四 组 
七 个 等 级 。 依 次 为 D.C(C1、C2)、B(B1、B2、B3)、A(A1) ,安全 性 级 别 划 分 如 表 6-1 所 示 。 


表 6-1 安全 级 别 
安全 级 别 定 义 
Al 验证 设计 (verified design) 
B3 安全 域 (security domains) 
B2 结构 化 保护 (structural protection) 
Bl 标记 安全 保护 (labeled security protection) 
C2 受 控 的 存 取 保护 (controlled access protection) 
Ci 自主 安全 保护 (discretionary security protection) 
D 最 小 保护 (minimal protection) 


这 里 要 说 明 的 是 : 数据 库 安全 常用 的 级 别 是 C2 级 .Bl1 级 和 B2 级 。 

1. TCSEC/TDI 标准 

TCSEC/TDI 标准 是 目前 常用 的 标准 , 现 介绍 如 下 。 

(1) D 级 标准 : 该 级 是 最 低级 别 ,为 基本 无 安全 保护 的 系统 。 

保留 D 级 的 目的 是 为 了 将 一 切 不 符合 更 高 标准 的 系统 统 归 于 D 组 。 如 DOS 就 是 操作 
系统 中 安全 标准 为 D 级 的 典型 例子 , 它 具 有 操作 系统 的 基本 功能 ,如 文件 系统 、 进 程 调度 
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等 ,但 在 安全 性 方面 几乎 没有 什么 专门 的 机 制 来 保障 。 

(2) C1 级 标准 。 该 级 只 提供 了 非常 初级 的 自主 安全 保护 ,满足 该 级 别 的 系统 必须 具有 
如 下 功能 : 

O@ 用 户 和 数据 的 分 离 ; 

@ 身份 标识 与 鉴别 ; 

@ 自主 存 取 控制 (Discretionary Access Control,DAC) ; 

@ 保护 或 限制 用 户 权 限 的 传播 。 

其 核心 是 自主 存 取 控制 。C1 级 安全 适合 于 单机 工作 方式 , 现 有 的 商业 系统 往往 稍 作 改 
进 , 即 可 满足 要 求 。 目 前 国内 使 用 的 系统 大 都 符合 此 标准 。 

(3) C2 级 标准 。 满 足 该 级 别 的 系统 必须 具有 如 下 功能 : 

QO 满足 Cl 标准 的 全 部 功能 ,并 将 C1 级 的 DAC 进一步 细 化 ; 

@ 以 个 人 身份 注册 负责 ; 

@ 审计 和 资源 隔离 。 

C2 级 安全 的 核心 是 审计 。 该 级 实际 上 是 安全 产品 的 最 低档 ,提供 受 控 的 存 取保 护 。 很 
多 商业 产品 已 得 到 C2 级 别 的 认证 。 达 到 C2 级 的 产品 在 其 名 称 中 往往 不 突出 “安全 ”这 一 
特色 。 如 操作 系统 中 的 Windows 2000, 数 据 库 产品 中 的 Oracle 7 等 。 

(4) Bl 级 标准 。 满 足 该 级 别 的 系统 必须 具有 如 下 功能 : 

QO 满足 C2 标准 的 全 部 功能 ; 

@ 实施 强制 存 取 控制 (Mandatory Access Control, MAC); 

@ 审计 。 

Bl 级 安全 的 核心 是 强制 存 取 控制 ,该 安全 级 别 适 于 网 络 工作 方式 。 只 有 具有 该 级 别 的 
产品 才 被 认为 是 真正 意义 上 的 安全 产品 ,满足 此 级 别 的 产品 前 一 般 多 冠 以 “安全 ” 
(Security) 或 “可 信和 的 ”Trusted) 字 样 , 作 为 区 别 于 普通 产品 的 安全 产品 出 售 。B1 级 能 够 较 
好 地 满足 大 型 企业 或 一 般 政 府 部 门 对 于 数据 的 安全 需求 ,数据 库 系统 中 符合 Bl 级 标准 者 
称 为 安全 数据 库 系统 或 可 信和 数据 库 系 统 。 例 如 ,数据 库 产品 有 Oracle 公司 的 Oracle 9i， 
IBM 公司 的 DB2 V8.2 等 。 

(5) B2 级 标准 。 满 足 该 级 别 的 系统 必须 具有 如 下 功能 : 

| 满足 Bl 标准 的 全 部 功能 ; 

@ 预防 隐蔽 通道 ， 

@ 数据 库 安 全 的 形式 化 。 

B2 级 是 结构 化 保护 。 建 立 形式 化 的 安全 策略 模型 ,并 对 系统 内 的 所 有 主体 和 客体 实施 
DAC 和 MAC。B2 级 安全 核心 是 预防 隐蔽 通道 与 安全 的 形式 化 , 它 适 合 于 网 络 工作 方式 。 

目前 ,经 过 认证 的 `.B2 级 以 上 的 安全 系统 非常 少 。 例 如 ,符合 B2 级 标准 的 操作 系统 有 
Trusted Information Systems 公司 的 Trusted XENIX 产品 等 。 现 国内 外 均 尚 无 符合 此 类 
标准 的 数据 库 产品 ,其 主要 的 难点 是 数据 库 安 全 的 形式 化 表示 困难 。 

(6) B3 级 标准 。 满 足 该 级 别 的 系统 必须 具有 如 下 功能 : 

Q@ 满足 B2 级 标准 的 全 部 功能 ; 

@ 访问 监控 器 。 

B3 级 安全 核心 是 访问 监控 器 , 它 适 合 于 网 络 工 作 方 式 。 该 级 的 TCB (Trusted 


Computing Base) 必 须 满足 访问 监控 器 的 要 求 , 审 计 跟 踪 能 力 更 强 , 并 提供 系统 恢复 过 程 。 
目前 国内 外 均 尚 无 符合 此 类 标准 的 系统 。 

(7) A 级 标准 。 满 足 该 级 别 的 系统 必须 具有 如 下 功能 : 

@ 满足 B3 级 标准 的 全 部 功能 ; 

@ 较 高 的 形式 化 要 求 。 

此 级 为 安全 最 高 等 级 , 即 提供 B3 级 保护 的 同时 给 出 系统 的 形式 化 设计 说 明和 验证 ,以 
确保 各 安全 保护 真正 实现 。 该 级 别 应 具有 完善 的 形式 化 要 求 , 目 前 尚 无 法 实现 , 仅 是 一 种 理 
想 化 的 等 级 。 

2. 我 国 国家 标准 

1996 年 国际 标准 化 组 织 ISO 颁布 了 “信息 技术 安全 -信息 技术 安全 性 评估 准则 ” 
(Information Technology Security Techniques-Evaluation Criteria for IT Security) ,简称 
CC 标准。 其 CC V2. 1 版 本 于 1999 年 被 ISO 采用 为 国际 标准 。2001 年 被 我 国 作 为 国家 标 
准 , 该 标准 与 TESEC 标准 比较 ,有 近似 对 应 的 级 别 , 如 表 6-2 所 示 。 


表 6-2 TCSEC 标准 与 国标 的 级 别 对 照 


TCSEC 标准 我 国标 准 (CC 评估 保证 级 ) 
Al 级 标准 EAL7: 形式 化 验证 的 设计 和 测试 
B3 级 标准 EAL6: 半 形 式 化 验证 的 设计 和 测试 
B2 级 标准 EAL5: 半 形 式 化 设计 和 测试 
Bl 级 标准 EAL4: 系统 地 设计 ,测试 和 复查 
C2 级 标准 EAL3: 系统 地 测试 和 检查 
C1 级 标准 EAL2: 结构 测试 
EAL1: 功能 测试 


6.2 数据 库 安 全 性 控制 


在 一 般 计算 机 系统 中 ,安全 措施 是 一 级 一 级 层 层 设置 的 。 例 如 ,在 图 6. 1 所 示 的 安全 模 
型 中 ,用 户 要 求 进入 计算 机 系统 时 ,系统 首先 根据 输入 的 用 户 标识 进行 用 户 身份 鉴定 ,只 有 
合法 的 用 户 才 准许 进入 计算 机 系统 ; 对 已 进入 系统 的 用 户 ,数据库 管理 系统 还 要 进行 存 取 
控制 ,只 允许 用 户 执行 合法 操作 。 

DBMS 的 安全 子 系统 主要 包括 两 部 分 。 

@ 定义 用 户 权限 : 定义 用 户 使 用 数据 库 的 权限 ,并 将 用 户 权限 登记 到 数据 字典 中 。 

@ 合法 权限 检查 : 若 用 户 的 操作 请 求 超出 了 定义 的 权限 ,系统 将 拒绝 执行 此 操作 。 

在 数据 库 系统 中 ,控制 的 数据 对 象 不 仅 有 数据 本 身 , 如 表 、 属 性 列 等 ,还 有 模式 、 外 模式 、 
内 模式 等 数据 字典 中 的 内 容 , 定 义 存 取 权限 为 授权 。 操 作 系 统 也 会 有 自己 的 保护 措施 ,数据 
最 后 还 可 以 以 密码 的 形式 存储 到 数据 库 中 。 

关于 操作 系统 的 安全 保护 措施 ,例如 : 强力 逼迫 透露 口令 .盗窃 物理 存储 设备 等 行为 、 
对 出 入 机 房 登记 以 及 加 锁 等 而 采取 的 保护 措施 ,不 在 数据 库 安全 的 讨论 之 列 。 读 者 如 果 想 
了 解 相关 内 容 , 可 参考 有 关 书 籍 ,这 里 不 再 袭 述 。 
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采用 的 数据 库 安全 性 控制 的 一 般 方法 有 用 户 标识 与 鉴别 、 存 取 控 制 , 视 图 机 制 、 数 据 加 
密 和 跟踪 审计 等 。 下 面 分 别 讨论 各 个 方面 的 内 容 。 


6.2.1 用 户 标识 与 鉴别 


任何 系统 软件 的 安全 性 控制 都 从 用 户 管理 开始 ,因此 用 户 标 识 和 鉴定 是 系统 提供 的 最 
外 层 安 全 保护 措施 ,是 界定 用 户 是 否 可 以 使 用 该 系统 的 第 一 层 认证 。 

其 方法 是 由 系统 提供 一 定 的 方式 让 每 个 用 户 在 系统 中 都 有 一 个 用 户 标 识 用 来 标识 自己 
的 名 字 或 身份 。 用 户 标 识 由 用 户 名 (User name) 和 用 户 标 识 号 (UID) 两 部 分 组 成 。 

UID 在 系统 的 整个 生命 周期 内 是 唯一 的 。 系 统 内 部 记录 着 所 有 合法 用 户 的 标识 ,每 次 
用 户 要 求 进入 系统 时 ,由 系统 将 用 户 提供 的 身份 标识 与 系统 内 部 记录 的 合法 用 户 标 识 进行 
核对 ,通过 鉴定 后 才 提 供 机 器 使 用 权 。 用 户 标识 和 鉴别 的 方法 有 很 多 种 ,而且 在 一 个 系统 中 
往往 是 多 种 方法 的 结合 ,以 获得 更 强 的 安全 性 。 

(1) 增加 口令 的 复杂 度 , 并 从 口令 的 管理 .存储 及 传输 等 多 方面 保障 口令 的 安全 可 靠 。 
例如 ,要 求 口令 长 度 至 少 是 8 个 (或 者 更 多 ) 字 符 ; 口令 要 求 是 字母 .数字 和 特殊 字符 混合 ， 
其 中 ,特殊 符号 是 除 空白 字符 、 英 文字 母 . 单 引号 和 数字 外 的 所 有 可 见 字 符 。 在 此 基础 上 , 管 
理 员 还 能 根据 应 用 需求 灵活 地 设置 口令 强度 ,例如 , 设 定 口令 中 数字 .字母 或 特殊 符号 的 个 
数 ; 设置 口令 是 否 可 以 是 最 简单 的 常见 单词 ,是 否 允 许 口令 与 用 户 名 相同 ; 设置 重复 使 用 
口令 的 最 小 时 间 间 隔 ; 有 的 数据 库 系统 支持 用 户 在 口令 中 使 用 非 打 印字 符 或 在 口令 的 末尾 
加 入 空格 ,这 样 即使 有 人 看 到 口令 ,也 是 不 完整 的 ,仍然 无 法 进入 系统 等 。 

(2) 有 的 数据 库 系统 对 用 户口 令 进行 加 密 保存 ,在 存储 和 传输 过 程 中 口令 信息 不 可 见 ， 
这 样 即使 有 人 看 到 数据 库 中 用 户 信息 ,也 无 法 破解 原始 密码 。 用 户 身份 鉴别 可 以 重复 多 次 。 

(3) 动态 口令 鉴别 。 它 是 目前 较为 安全 的 鉴别 方式 。 这 种 方式 的 口令 是 动态 变化 的 ， 
每 次 鉴别 时 均 需 使 用 动态 产生 的 新 口令 登录 数据 库 管理 系统 , 即 采 用 一 次 一 密 的 方法 。 每 
次 登录 数据 库 管理 系统 采取 “询问 -回答 ”的 机 制 , 即 每 个 用 户 都 预先 约定 好 一 个 计算 函数 ， 
验证 用 户 身份 时 ,系统 提供 一 个 随机 数 , 用 户 根 据 自 己 预先 约定 的 计算 函数 进行 计算 ,系统 
根据 用 户 的 计算 结果 是 否 正 确 来 判断 用 户 身份 是 否 合法 。 这 种 方法 没有 口令 在 系统 中 保存 
或 在 网 络 上 传送 ,增加 了 口令 被 窃取 或 破解 的 难度 ,不 存在 口令 泄漏 问题 。 

(4) 生物 特征 鉴别 。 这 是 一 种 安全 性 较 高 的 认证 技术 。 它 是 通过 生物 特征 进行 认证 
的 ,这 些 生 物 特 征 包括 签名 指纹 .虹膜 ,声音 和 掌 纹 等 。 它 们 都 是 生物 体 唯一 具有 的 、 可 测 
量 \ 识 别 和 验证 的 稳定 生物 特征 。 这 种 方式 通过 采用 图 像 处 理 和 模式 识别 等 技术 实现 了 基 
于 生物 特征 的 认证 ,与 传统 的 口令 鉴别 相 比 ,无 疑 产生 了 质 的 飞跃 。 但 需要 昂贵 的 鉴别 装 
置 ,因而 影响 了 这 种 鉴别 方法 的 推广 。 但 随 着 电子 设备 价格 的 下 隆 ,生物 特征 鉴别 方法 会 越 
来 越 得 到 广泛 的 应 用 。 

(5) 智能 卡 鉴别 。 智 能 卡 是 一 种 不 可 复制 的 硬件 ,内 置 集成 电路 的 芯片 ,具有 硬件 加 密 
功能 。 智 能 卡 由 用 户 随身 携带 ,登录 数据 库 管理 系统 时 用 户 将 智能 卡 插入 专门 的 读 卡 器 进 
行 身份 验证 。 由 于 每 次 从 智能 卡 中 读 取 的 数据 是 静态 的 ,通过 内 存 扫描 或 网 络 监 听 等 技术 
还 是 可 能 截取 用 户 的 身份 验证 信息 ,并 且 智 能 卡 也 有 丢失 的 危险 ,这 种 方法 同样 存在 安全 隐 
患 。 因 此 ,实际 应 用 中 一 般 采 用 个 人 身份 识别 码 (PIN) 和 智能 卡 相 结 合 的 方式 。 这 样 , 即 使 
PIN 或 智能 卡 中 有 一 种 被 窃取 ,用 户 身 份 仍 不 会 被 冒充 。 


6.2.2 存 取 控 制 


为 了 保证 数据 库 的 安全 性 ,数据库 系统 最 重要 的 就 是 确保 只 授权 给 有 资格 的 用 户 访问 
数据 库 的 权限 ,同时 令 所 有 未 被 授权 的 人 员 无 法 接近 数据 , 即 要 保证 用 户 只 能 存 取 其 有 权 存 
取 的 数据 。 这 主要 通过 数据 库 系 统 的 存 取 控制 机 制 实现 。 

存 取 控制 是 指 对 用 户 访问 数据 库 各 种 资源 的 权利 的 控制 。 这 里 的 资源 是 指 基 本 表 、 视 
图 、 各 种 目录 以 及 实用 程序 等 数据 库 对 象 ,而 权利 是 指 对 各 种 数据 库 对 象 进行 创建 ,撤销 、 查 
询 \ 增 、 删 、 改 等 。 

存 取 控 制 机 制 主要 包括 定义 用 户 权 限 和 合法 权限 检查 两 部 分 。 

(1) 定义 用 户 权限 。 定 义 一 个 用 户 的 存 取 权限 就 是 定义 一 个 用 户 可 以 在 哪些 数据 对 象 
上 进行 哪些 类 型 的 操作 。 在 数据 库 系 统 中 ,定义 存 取 权限 称 为 授权 (authorization) 。 

在 SQL 中 ,有 两 种 授权 方式 : 

@ 由 DBA 授予 某 类 数据 库 用 户 的 特权 ; 

@ 由 DBA 或 由 数据 对 象 的 创建 者 授予 对 某 些 数据 对 象 进行 某 些 操作 的 特权 。 

用 户 对 某 一 数据 对 象 的 操作 权利 称 为 权限 。 数 据 库 管理 系统 的 功能 是 保证 这 些 决 定 的 
执行 。 为 此 ,数据 库 管理 系统 必须 提供 适当 的 语言 来 定义 用 户 权限 ,这些 定义 经 过 编译 后 存 
储 在 数据 字典 中 ,被 称 作 安全 规则 或 授权 规则 。 

在 数据 目录 中 ,有 一 张 授 权 表 ,记录 了 每 个 数据 库 的 授权 情况 。 在 数据 库 中 ,许多 用 户 
的 权限 相同 ,如 分 别 授权 ,十 分 繁琐 。 可 以 为 每 个 用 户 定 义 一 个 角色 ,然后 对 角色 授权 , 某 用 
户 承 担 某 种 角色 就 拥有 该 角色 的 权限 ,这 样 就 简单 了 。 当 然 , 一 个 用 户 可 以 拥有 多 个 角色 和 
其 他 权限 。 关 于 数据 库 角 色 的 介绍 将 在 6. 2. 3 节 进 行 。 

用 户 在 数据 对 象 上 的 存 取 权 限 有 以 下 几 种 。 

Q@ read 权限 允许 读 取 数 据 , 但 不 允许 修改 数据 。 

@ insert 权限 允许 插入 新 数据 ,但 不 允许 修改 已 经 存在 的 数据 。 

@ update 权限 允许 修改 数据 ,但 不 允许 删除 数据 。 

@ delete 权限 允许 删除 数据 。 

@ index 权限 允许 创建 和 删除 索引 。 

resource 权限 允许 创建 新 关系 。 

@ alteration 权限 允许 添加 或 删除 关系 中 的 属性 。 

@ drop 权限 允许 删除 关系 。 

注意 : delete 权限 和 drop 权限 的 区 别 在 于 delete 权限 只 允许 对 关系 中 的 元 组 进行 删 
除 , 即 使 删除 了 关系 中 所 有 的 元 组 ,关系 仍然 存在 。drop 权限 删除 的 是 整个 关系 ,删除 后 关 
系 不 再 存在 。 

具有 resource 权限 的 用 户 在 创建 新 关系 后 自动 获得 该 关系 上 的 所 有 权限 。 

(2) 合法 权限 检查 。 每 当 用 户 发 出 存 取 数据 库 的 操作 请 求 后 ,DBMS 查找 数据 字典 , 根 
据 每 个 用 户 的 存 取 权限 进行 合法 性 检查 ,车 用 户 的 操作 请 求 超出 了 定义 的 权限 ,系统 将 拒绝 
执行 该 操作 。 

常用 的 存 取 控制 方法 有 如 下 两 类 。 

Q@ 自主 存 取 控 制 (DAC)。 用 户 对 不 同 的 数据 对 象 有 不 同 的 存 取 权限 ,不 同 用 户 对 同一 
对 象 也 有 不 同 的 存 取 权限 ,用 户 还 可 以 将 其 拥有 的 存 取 权 限 授予 其 他 用 户 。 因 此 ,自主 存 取 
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控制 非常 灵活 。 该 方法 详 见 6. 2. 3 节 中 关于 如 何 实现 授权 和 回收 权限 问题 的 讨论 。 之 前 讨 
论 的 Cl 和 C2 级 的 数据 库 管理 系统 支持 自主 存 取 控 制 。 

@ 强制 存 取 控 制 (MAC)。 每 一 个 数据 库 对 象 被 标 以 一 定 的 密级 ,每 一 个 用 户 被 授予 
某 一 个 级 别 的 许可 证 。 对 任意 一 个 对 象 ,只 有 具有 合法 许可 证 的 用 户 才 可 以 存 取 ,强制 存 取 
控制 因此 相对 比较 严格 。B1 级 的 数据 库 管理 系统 支持 强制 存 取 控 制 。 强 制 存 取 控 制 的 相 
关内 容 介 绍 见 6. 2.4 节 。 


6.2.3 自主 存 取 控 制 方法 


大 型 数据 库 管 理 系统 都 支持 自主 存 取 控 制 ,SQL 标准 也 对 自主 存 取 控 制 提 供 支持 , 自 
主 存 取 控制 的 实现 主要 通过 SQL 的 GRANT 语句 和 REVOKE 语句 来 实现 。 

存 取 权 限 是 由 两 个 要 素 组 成 的 : 数据 库 对 象 和 操作 类 型 。 定 义 一 个 用 户 的 存 取 权 限 就 
是 要 定义 这 个 用 户 可 以 在 哪些 数据 库 对 象 上 进行 哪些 类 型 的 操作 。 在 数据 库 系统 中 ,这 些 
授权 定义 经 过 编译 后 存放 在 数据 字典 中 。 对 于 获得 上 机 权 后 又 进一步 发 出 存 取 数据 库 对 象 
操作 请 求 的 用 户 ,DBMS 查找 数据 字典 ,根据 其 存 取 权限 对 操作 的 合法 性 进行 检查 ,车 用 户 
操作 请 求 超出 了 定义 的 权限 ,系统 将 拒绝 执行 此 操作 。 首 先 讨论 用 户 的 分 类 以 及 关系 数据 
库 系 统 的 存 取 权限 。 

1. 用 户 分 类 与 权限 

为 了 实现 访问 控制 ,需要 对 数据 库 的 用 户 分 类 。 一 般 可 对 数据 库 的 用 户 分 为 4 类: 系 
统 用 户 (DBA) .数据 对 象 的 属 主 (Owner) 一般 用 户 、 公 共用 户 (Public)。 

Q@ 系统 用 户 : 一 般 是 指 系统 管理 员 或 数据 库 管 理 员 DBA ,他 们 拥有 数据 库 系 统 可 能 提 
供 的 全 部 权限 。 

@ 数据 对 象 的 属 主 : 是 创建 某 个 数据 对 象 的 用 户 , 如 一 个 表 属 主创 建 了 某 个 表 , 他 就 
具有 对 该 表 的 更 新 、 删 除 、 建 索引 等 所 有 的 操作 权限 。 

@ 一 般 用 户 : 是 指 那 些 经 过 授权 被 允许 对 数据 库 进行 某 些 特定 数据 操作 的 用 户 。 

@ 公共 用 户 : 是 为 了 方便 共享 数据 操作 而 设置 的 , 它 代 表 全 体 数据 库 用 户 。 

不 同 用 户 ( 或 应 用 程序 ) 对 数据 库 的 使 用 方式 是 不 同 的 ,用 户 对 数据 库 的 使 用 方式 称 为 
“权限 ”。 

在 关系 数据 库 系 统 中 , 存 取 控制 的 对 象 不 仅 有 数据 本 身 ( 基 本 表 中 的 数据 、 属 性 列 上 的 
数据 ) ,还 有 数据 库 模 式 ( 包 括 数据 库 、 基 本 表 、 视 图 和 索引 的 创建 等 ), 表 6-3 列 出 了 关系 数 
据 库 系统 中 通常 拥有 的 几 种 存 取 权限 。 

表 6-3 关系 数据 库 系统 中 的 存 取 权 限 


对 象 类 型 对 象 操作 类 型 

模式 CREATE SCHEMA 

基本 表 CREATE TABLE, ALTER TABLE 
数据 库 模 式 

视图 CREATE VIEW 

索引 CREATE INDEX 

SELECT, INSERT, UPDATE, DELETE, REFERENCES, ALL 

数据 基本 突入 国 PRIVILEGES 

属性 列 SELECT,INSERT,UPDATE,REFERENCES,ALL PRIVILEGES 


另外 ,衡量 授权 机 制 是 否 灵活 的 一 个 重要 指标 是 授权 粒度 , 即 可 以 定义 的 数据 对 象 范 
围 。 授 权 定 义 中 数据 对 象 的 粒度 越 细 ,授权 子 系统 就 越 灵 活 ,能够 提供 的 安全 性 就 越 完善 ; 
但 系统 定义 与 检查 权限 的 开销 也 会 相应 增 大 。 

在 关系 数据 库 中 ,授权 的 数据 对 象 粒度 包括 表 、 属 性 列 .元 组 。 另外 ,还 可 以 在 存 取 谓 词 
中 引用 系统 变量 。 如 终端 设备 号 、 系 统 时 钟 等 ,这 就 是 与 时 间 、 地 点 有 关 的 存 取 权限 ,这 样 用 
户 只 能 在 某 段 时 间 内 的 某 台 终端 上 存 取 有 关 数 据 。 

2. 授权 : 授予 与 收回 

自主 存 取 控制 的 实施 主要 通过 授权 来 进行 。 授 权 就 是 给 予 用 户 一 定 的 访问 数据 库 的 特 
权 。 一 个 用 户 可 以 把 他 所 拥有 的 权限 转 授 给 其 他 用 户 , 也 可 以 把 已 转 授 给 其 他 用 户 的 权限 
收回 。 

上 节 谈 到 ,自主 存 取 控制 的 实现 主要 通过 SQL 的 GRANT 语句 和 REVOKE 语句 来 实 
现 向 用 户 授 予 和 收回 对 数据 的 操作 权限 。GRANT 语句 向 用 户 授予 权限 ,REVOKE 语句 回 
收 已 经 授予 用 户 的 权限 。DBMS 必须 具有 以 下 功能 。 

。 把 授权 的 决定 告知 系统 ,这 是 由 SQL 的 GRANT 和 REVOKE 语句 来 完成 的 。 

。 把 授权 的 结果 存 人 数据 字典 。 

。 当 用 户 提 出 操作 请 求 时 ,根据 授权 情况 进行 检查 ,决定 是 否 执行 操作 请 求 。 

下 面 将 详细 介绍 这 两 条 语句 。 

(1) GRANT 

GRANT 语句 的 一 般 格式 为 : 

GRANT < 权限 >[ ,< 权限 >] … | ALL PRIVILIGES 

ON < 对 象 类 型 > < 对 象 名 >[,< 对 象 类 型 >< 对 象 名 >] … 

TO < 用 户 >[ ,< 用户 >] … 

[WITH GRANT OPTION]; 

其 语义 为 : 将 对 指定 操作 对 象 的 指定 操作 权限 授予 指定 的 用 户 。 其 中 : 

@ 权限 : 可 以 是 SELETE INSERT、UPDATE DELETE、ALTER INDEX、ALL, 对 
于 视图 特权 只 有 SELETE .INSERT .UPDATE 和 DELETE。ALL PRIVILIGES 指 所 有 的 
对 象 特权 。 

@ 对 象 名 指 操作 的 对 象 标识 , 它 包 括 表 名 、 视 图 名 和 过 程 名 等 。 

@ 接受 权限 的 用 户 可 以 是 一 个 或 多 个 具体 用 户 , 也 可 以 是 PUBLIC, PUBLIC 指 所 有 
的 用 户 。 

@ WITH GRANT OPTION 指 允 许 用 户 再 将 该 操作 权 授 予 别 的 用 户 。 

发 出 该 GRANT 子 句 的 可 以 是 数据 库 管 理 员 ,也 可 以 是 该 数据 库 对 象 创建 者 ,还 可 以 
是 已 经 拥有 该 权限 的 用 户 。 

SQL 标准 允许 具有 WITH GRANT OPTION 的 由 Uw U3。U 
用 户 把 相应 权限 或 其 子 集 传递 授予 其 他 用 户 , 但 不 允 人 
许 循 环 授 权 , 即 被 授权 者 不 能 把 权限 再 授 回 给 授权 者 
或 其 祖先 ,如 图 6-3 所 示 。 

【 例 1】 把 查询 Student 表 的 权限 授 给 用 户 Ul 。 


| 


6-3 不 允许 循环 授权 


GRANT SELECT 


数据 库 安 会 性 


地 口 典 


数据 库 原 理 及 应 用 教程 一 -SQL Server 2014 


ON TABLE Student 

TOUl; 

解 题 说 明 : 

本 题 不 允许 用 户 U1 将 得 到 的 权力 再 赋予 别 的 用 户 。 

【 例 2】 把 修改 学 生 学 号 和 查询 学 生 表 的 权力 授予 用 户 U2。 

GRANT UPDATE (Sno) SELECT 

ON TABLE Student 

TO U2; 

解 题 说 明 : 

实际 上 要 授予 U2 用 户 的 是 对 基本 表 Student 的 SELECT 权限 和 对 属性 列 Sno 的 


UPDATE 权限 。 对 属性 列 授权 时 必须 明确 指出 相应 的 属性 列 名 。 


权 


ws 


【 例 3】 把 对 Student 表 和 Course 表 的 全 部 操作 权限 授予 用 户 U3 和 U4。 


GRANT ALL PRIVILEGES 

ON TABLE Student, Course 

TO U3, U4; 

解 题 说 明 : 

ALL PRIVILEGES 指 所 有 的 对 象 特权 。 把 对 基本 表 Student 和 Course 所 有 的 对 象 特 
对 给 用 户 U3 和 U4。 

【 例 4】 把 对 表 SC 的 查询 权限 授予 所 有 用 户 。 

GRANT SELECT 

ON TABLE SC 

TO PUBLIC; 

解 题 说 明 : 

PUBLIC 指 所 有 用 户 。 

【 例 S】 把 对 表 SC 的 INSERT 权限 授予 U5 用 户 , 并 允许 将 此 权限 再 授予 其 他 用 户 。 

GRANT INSERT 

ON TABLE SC 

TO 05 

WITH GRANT OPTION; 

解 题 说 明 : 

执行 此 SQL 语句 后 ,U5 不 仅 拥有 了 对 表 SC 的 INSERT 权限 ,还 可 以 传播 此 权限 , 即 


由 U5 用 户 发 上 述 GRANT 命令 给 其 他 用 户 。 例 如 U5 可 以 将 此 权限 授予 U6。 


【 例 6] 


GRANT INSERT 

ON TABLE SC 

TO U6; 

解 题 说 明 : 

U6 不 能 再 传播 此 权限 。 


【 例 7】 DBA 把 在 数据 库 Stud 中 建立 表 的 权限 授予 用 户 U7。 


GRANT CREATETAB 

ON DATABASE Stud 

TO U7; 

GRANT 语句 可 以 : 

@ 一 次 向 一 个 用 户 授权 ; 

@ 一 次 向 多 个 用 户 授权 ; 

@ 一 次 传播 多 个 同类 对 象 的 权限 ; 

@ 一 次 可 以 完成 对 基本 表 、 视 图 和 属性 列 这 些 不 同 对 象 的 授权 。 

注意 : 授予 关于 DATABASE 的 权限 必须 与 授予 关于 TABLE 的 权限 分 开 , 因 为 对 象 
类 型 不 同 。 

(2) REVOKE 

数据 库 管 理 员 DBA、 数 据 库 拥有 者 DBO (建立 数据 库 的 人 ) 或 数据 库 对 象 拥有 者 
DBOO( 数 据 库 对 象 主要 是 基本 表 ) 可 以 通过 REVOKE 语句 将 其 他 用 户 的 数据 操作 权 
收回 。 

REVOKE 语句 的 一 般 格 式 为 : 

REVOKE < 权限 > [,< 权 限 >] … | ALL PRIVILIGES 

ON < 对 象 类 型 >< 对 象 名 >[,< 对 象 类 型 >< 对 象 名 >] … 

FROM < 用 户 >[， < 用户 >]… | PUBLIC 

[CASCRDE|RESTRICT] ; 

其 中 : ON 子 句 用 于 指定 被 收回 特权 的 对 象 ; ALL PRIVILIGES 指 收回 所 有 特权 ; 
PUBLIC 指 所 有 用 户 ; CASCADE 指 级 联 , 即 删除 或 修改 目标 表 的 元 组 时 ,同时 删除 或 修改 
依赖 表 中 对 应 候选 码 所 指定 的 元 组 , 且 收 回 权 限 操作 会 级 联 下 去 ,但 系统 只 收回 直接 或 间接 
从 某 处 获得 的 权限 。 

【 例 8】 将 用 户 U2 可 以 在 学 生 表 中 修改 学 生 学 号 的 权力 收回 。 

REVOKE UPDATE( Sno) 


ON TABLE Student 
FROM U2; 


【 例 9】 收回 所 有 用 户 对 表 SC 的 查询 权限 。 


REVOKE SELECT 
ON TABLE SC 
FROM PUBLIC; 


【 例 10】 把 用 户 U5 对 SC 表 的 INSERT 权限 收回 。 


REVOKE INSERT 
ON TABLE SC 
FROM U5 CASCADE; 


解 题 说 明 : 6 
将 用 户 U5 的 INSERT 权限 收回 的 同时 ,级 联 (CASCADE) 收 回 了 U6 的 INSERT 权 | 章 
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限 ,否则 系统 将 拒绝 执行 该 命令 。 因 为 在 例 6 中 ,U5 将 对 SC 表 的 INSERT 权限 授予 
7 V6。 

另外 要 注意 的 是 : 这 里 默认 值 为 CASCADE, 有 的 数据 库 管理 系统 默认 值 为 RESTRICT， 
将 自动 执行 级 联 操作 。 如 果 U6 还 从 其 他 用 户 处 获得 对 SC 表 的 INSERT 权限 , 则 它 仍 具 
有 此 权限 ,系统 只 收回 直接 或 间接 从 U5 处 获得 的 权限 。 

SQL 提供 了 非常 灵活 的 授权 机 制 。 数 据 库 管理 员 拥有 对 数据 库 中 所 有 对 象 的 所 有 权 
限 ,并 可 以 根据 实际 情况 将 不 同 的 权限 授予 不 同 的 用 户 。 

用 户 对 自己 建立 的 基本 表 和 视图 拥有 全 部 的 操作 权限 ,并且 可 以 用 GRANT 语句 把 其 
中 某 些 权限 授予 其 他 用 户 。 被 授权 的 用 户 如 果 有 “继续 授权 ”的 许可 ,还 可 以 把 获得 的 权限 
再 授予 其 他 用 户 。 

所 有 授予 出 去 的 权限 在 必要 时 又 都 可 以 用 REVOKE 语句 收回 。 

可 见 , 用 户 可 以 “自主 ”决定 将 数据 的 存 取 权限 授予 何人 ,决定 是 否 也 将 “授权 ”的 权限 授 
予 别 人 。 因 此 称 这 样 的 存 取 控 制 为 自主 存 取 控制 。 

3. 授权 图 

在 处 理 复 杂 的 授权 与 回收 问题 时 ,通常 通过 授权 图 来 明确 用 户 之 间 的 授权 关系 。 在 授 
权 图 中 , 根 节点 表示 数据 库 管理 员 (DBA) 节 点 ,节点 表示 用 户 ,图 中 的 有 向 边 U; 一 U; 表示 
用 户 U; 将 某 权限 授予 用 户 U;。 一 个 用 户 拥 有 某 种 权限 的 充 要 条 件 是 在 授权 图 中 从 根 节点 
到 该 用 户 节点 存在 一 条 路 径 。 

【 例 11】 假设 数据 库 管理 员 (DBA) 把 某 权 限 授予 用 户 U1、U2。U1 再 将 权限 授予 用 
户 U3 和 U4,U2 将 权限 授予 U4。 该 授权 过 程 的 授权 图 如 图 6-4 所 示 。 


6-4 例 11 授权 图 


如 果 DBA 将 Ul 的 权限 回收 ,那么 U3 的 权限 也 同时 被 回收 ,但 是 U4 的 权限 同时 从 
Ul 和 U2 两 处 获得 ,回收 Ul 的 权限 不 会 影响 到 U4 的 权限 ,U4 的 权限 仍 被 保留 。 只 有 当 
U2 的 权限 也 被 回收 时 ,U4 的 权限 才 被 回收 。 

4. 数据 库 角色 

使 用 角色 的 目的 是 为 了 简化 授权 的 过 程 。 一 个 数据 库 角 色 是 被 命名 的 一 组 与 数据 库 操 
作 相 关 的 权限 ,角色 是 权限 的 集合 。 在 SQL 中 ,授权 一 个 角色 给 一 个 用 户 , 则 允许 该 用 户 使 
用 被 授权 的 角色 所 拥有 的 每 一 个 权限 。 用 户 与 角色 之 间 存 在 多 对 多 的 联系 ; 一 个 用 户 人 允许 
被 授予 多 个 角色 ,同一 个 角色 可 被 授予 多 个 用 户 。 一 个 角色 也 可 以 被 授予 另 一 个 角色 的 权 
限 。 因 此 ,可 为 一 组 具有 相同 权限 的 用 户 创建 一 个 角色 ,使 用 角色 来 管理 数据 库 权 限 可 简化 
授权 的 过 程 。 

在 SQL 中 先 用 CREATE ROLE 语句 创建 角色 ,然后 用 GRANT 语句 给 角色 授权 ,用 
REVOKE 语句 收回 授予 角色 的 权限 。 


(1) 角色 的 创建 
用 CREATE ROLE 语句 创建 角色 。 其 SQL 语句 格式 是 : 


CREATE ROLE < 角色 名 > 


刚刚 创建 的 角色 是 空 的 ,没有 任何 内 容 。 可 以 用 GRANT 为 角色 授权 。 

(2) 给 角色 授权 

用 GRANT 语句 将 权限 授予 某 一 个 或 几 个 角色 。 其 SQL 语句 格式 是 ， 

GRANT < 权限 >[ ,< 权限 ] -… 

ON < 对 象 类 型 > < 对 象 名 > 

TO < 角色 >[ ,< 角色 >] … 

数据 库 管 理 员 和 用 户 可 以 利用 GRANT 语句 将 权限 授予 某 一 个 或 几 个 角色 。 

(3) 将 一 个 角色 授予 其 他 的 角色 或 用 户 

用 GRANT 语句 将 角色 授予 其 他 的 角色 或 用 户 。 其 SQL 语句 格式 是 : 

GRANT < 角色 1 >[ ,< 角色 2>]… 

TO < 角色 3>[ ,< 用 户 1>]… 

[WITH ADMIN OPTION] 

该 语句 功能 是 : 把 角色 授予 某 用 户 ,或 授予 另 一 个 角色 。 这 样 ,一 个 角色 (例如 角色 3) 
所 拥有 的 权限 就 是 授予 它 的 全 部 角色 (例如 角色 1 和 角色 2) 所 包含 的 权限 的 总 和 。 

授予 者 或 者 是 角色 的 创建 者 ,或 者 拥有 在 这 个 角色 上 的 ADMIN OPTION 。 

其 中 , 若 指定 了 WITH ADMIN OPTION 子 句 , 则 获得 某 种 权限 的 角色 或 用 户 还 可 以 
把 这 种 权限 再 授予 其 他 的 角色 。 

因此 ,一 个 角色 包含 的 权限 包括 直接 授予 这 个 角色 的 全 部 权限 加 上 其 他 角色 授予 这 个 
角色 的 全 部 权限 。 

5. 角色 权限 的 收回 

用 REVOKE 可 回收 角色 的 权限 ,或 改变 角色 拥有 的 权限 。 其 SQL 语句 格式 是 : 

REVOKE << 权 限 >[ ,< 权限 >] … 

ON < 对 象 类 型 > < 对 象 名 > 

FROM(< 角 色 >[ ,< 角色 >] … 

用 户 可 以 收回 角色 的 权限 ,从 而 修改 角色 拥有 的 权限 。 

REVOKE 动作 的 执行 者 或 者 是 角色 的 创建 者 ,或 者 拥有 在 这 个 ( 些 ) 角 色 上 的 ADMIN 
OPTION。 

下 面 通 过 角色 来 实现 将 一 组 权限 授予 某 些 用 户 以 及 修改 .回收 权限 。 

步骤 如 下 : 

@ 创建 一 个 角色 R1; 

@ 用 GRANT 语句 ,使 角色 R1 拥有 Student 表 的 查询 ,修改 和 插入 数据 权限 ; 

@ 将 这 个 角色 授予 U1、U2、U3。 使 他 们 具有 角色 R1 所 包含 的 全 部 权限 ; 

@ 一 次 性 通过 REVOKE R1 来 回收 Ul 拥有 该 角色 的 所 有 权限 ; 

@@ 增加 角色 的 权限 。 使 角色 R1 在 原 基 础 上 增加 删除 数据 权限 ; 

@ 减少 角色 的 权限 。 去 除 角 色 R1 其 查询 数据 的 权限 。 
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实现 过 程 见 例 12 一 例 17。 
【 例 12】 创建 一 个 角色 R1。 


GREATE ROLE R1; 


【 例 13】 给 角色 授权 。 
用 GRANT 语句 ,使 角色 R1 拥有 Student 表 的 SELECT、UPDATE、INSERT 权限 。 
GRANT SELECT, UPDATE, INSERT 


ON TABLE Student 
TO R1; 


【 例 14】 将 这 个 角色 授予 U1、U2、U3, 使 他 们 具有 角色 R1 所 包含 的 全 部 权限 。 


GRANT R1 
TO U1,U2,03; 


【 例 15】 一 次 性 地 通过 R1 来 收回 U1 的 这 三 个 权限 。 


REVOKE R1 
FROM U1; 


【 例 16】 角色 的 权限 修改 (增加 角色 的 权利 )。 


GRANT DELETE 

ON TABLE Student 

TOR1; 

解 题 说 明 : 

使 角色 RI1 在 原来 的 基础 上 增加 了 对 Student 表 的 DELETE 权限 。 

【 例 17】 角色 的 权限 修改 (减少 角色 的 权限 )。 

REVOKE SELECT 

ON TABLE Student 

FROM R1; 

解 题 说 明 : 

使 Rl 减少 了 对 Student 表 的 SELECT 权限 。 

可 以 看 出 ,数据 库 角色 是 一 组 权限 的 集合 。 使 用 角色 来 管理 数据 库 权 限 可 以 简化 授权 
的 过 程 ,使 自主 授权 的 执行 更 加 灵活 方便。 


6.2.4 强制 存 取 控制 方法 


上 一 节 介 绍 了 自主 存 取 控 制 。 自 主 存 取 控 制 方法 尽管 有 效 , 但 是 对 数据 对 象 的 安全 性 
保障 存在 一 定 的 隐患 。 特 别 是 在 自主 访问 机 制 中 ,一 个 被 授权 用 户 可 以 利用 授权 用 户 , 令 其 
泄露 机 密 数 据 ,这 是 因为 虽然 可 以 通过 授权 机 制 有 效 地 控制 对 敏感 数据 的 存 取 ,但 是 由 于 用 
户 对 数据 的 存 取 权限 是 “自主 ”的 ,用 户 可 以 自由 地 决定 将 数据 的 存 取 权 限 授 予 何人 ,以 及 决 
定 是 否 也 将 “授权 ”的 权限 授予 别人 。 在 这 种 授权 机 制 下 ,就 有 可 能 存在 数据 的 “无 意 泄露 ”。 
比如 , 甲 将 自己 权限 范围 内 的 某 些 数据 存 取 权 限 授权 给 乙 , 甲 的 意图 是 仅 允 许 乙 本 人 操纵 这 
些 数据 。 但 甲 的 这 种 安全 性 要 求 并 不 能 得 到 保证 ,因为 乙 一 旦 获得 了 对 数据 的 权限 就 可 以 


将 数据 备份 ,获得 自身 权限 内 的 副本 ,并 在 不 征 得 甲 同意 的 前 提 下 传播 副本 。 造 成 这 一 问题 
的 根本 原因 就 在 于 ,这 种 机 制 仅仅 通过 对 数据 的 存 取 权 限 来 进行 安全 控制 ,而 数据 本 身 并 无 
安全 性 标记 。 

显然 ,还 需要 某 些 安全 机 制 来 消除 这 类 漏洞 ,强制 存 取 控 制 (MAC) 机 制 是 为 了 防止 
DAC 的 安全 漏洞 而 出 现 的 。 

所 谓 强制 存 取 控制 是 指 一 种 系统 级 的 策略 。 系 统 为 保护 更 高 程度 的 安全 性 ,按照 TDI/ 
TCSEC 标准 中 安全 策略 的 要 求 所 采取 的 强制 存 取 检查 手段 , 它 不 是 用 户 能 直接 感知 或 进行 
控制 的 。 

在 该 机 制 中 ,每 一 个 数据 库 对 象 都 被 赋予 了 一 个 敏感 度 标记 (也 称 为 密级 ) ,每 一 个 用 户 
也 被 赋予 了 某 种 安全 级 别 的 敏感 度 标记 (也 称 为 访问 许可 级 别 ) ,并且 制定 了 用 户 读 、 写 数据 
库 对 象 的 规则 。DBMS 根据 读 、 写 规则 ,比照 用 户 的 访问 许可 级 别 和 用 户 要 访问 对 象 的 安 
全 级 别 来 决定 是 否 允 许 用 户 的 此 次 读 、 写 操作 。 这 些 规则 是 为 了 确保 机 密 数 据 永远 不 会 被 
没有 相应 访问 许可 的 用 户 得 到 ,消除 数据 对 象 的 安全 隐患 。 下 面 介 绍 MAC 涉及 的 相关 术 
语 及 强制 存 取 控制 规则 。 

在 强制 存 取 控 制 方法 中 ,有 如 下 几 类 对 象 。 

主体 是 系统 中 的 活动 实体 , 既 包 括 数据 库 管理 系统 所 管理 的 实际 用 户 ,也 包括 代表 用 户 
的 各 进程 。 客 体 是 系统 中 的 被 动 实体 ,是 受 主体 操纵 的 ,包括 文件 .基本 表 、 索 引 、 视 图 等 。 
另外 ,对 于 主体 和 客体 ,数据 库 管 理 系 统 为 它们 每 个 实例 ( 值 ) 指 派 一 个 敏感 度 标 记 (Lable) 。 
敏感 度 标记 被 分 成 若干 级 别 ,例如 绝密 (Top Secret,TS)、 机密 (Secret,S)、 可 信 
(Confidential,C) ,公开 (Public,P) 等 。 密 级 的 次 序 是 TS>=S>=C>=P。 主 体 的 敏感 度 


标记 称 为 许可 证 级 别 (Clearance Level) ,客体 的 二 体 ; 客体 ， 
敏感 度 标记 称 为 密级 (Classification Level) 。 将 许可 证 级 别 密级 
主体 或 客体 A 的 级 别 标记 为 Class(A), 因 此 当 (Label) : 过 (Label) ， 
A>B 时 表示 A 级 别 数据 的 安全 性 要 高 于 B 级 | 。 凤 绝密 
别 的 数据 。 强 制 存 取 控 制 机 制 就 是 通过 对 比 主 机 密 机 密 
体 的 Lable 和 客体 的 Lable, 最 终 确定 主体 是 否 可 信 可 信 
能 够 存 取 客 体 ,如 图 6-5 所 示 。 公开 公开 


当 某 一 主体 以 标记 Label 注册 入 系统 时 , 系 
统 要 求 他 对 任何 客体 的 存 取 必须 遵循 如 下 规则 。 

(1) 仅 当 主体 的 许可 证 级 别 大 于 或 等 于 客 
体 的 密级 时 ,该 主体 才能 读 取 相应 的 客体 。 例 如 访问 许可 级 别 为 TS 的 主体 能 够 读 取 安 全 
级 别 为 C 的 客体 ,但 是 访问 许可 级 别 为 C 的 主体 不 能 够 读 取 安全 级 别 为 TS 的 客体 。 

(2) 仅 当 主体 的 许可 证 级 别 小 于 或 等 于 客体 的 密级 时 ,该 主体 才能 写 相应 的 客体 。 例 
如 访问 许可 级 别 为 S 的 主体 只 能 写 安全 级 别 为 S 或 TS 的 客体 。 

规则 (1) 的 意义 是 明显 的 ,而 规则 (2) 需 要 解释 一 下 。 按 照 规 则 (2) ,用户 可 以 为 写 人 的 
数据 对 象 赋予 高 于 自己 的 许可 证 级 别 的 密级 。 这 样 一 旦 数据 被 写 入 ,该 用 户 自 己 也 不 能 再 
读 该 数据 对 象 了 。 如 果 违 反 了 规则 (2) ,就 有 可 能 把 数据 的 密级 从 高 流向 低 ,造成 数据 的 泄 
漏 。 例 如 , 某 个 TS 密级 的 主体 把 一 个 密级 为 TS 的 数据 恶意 地 降低 为 P, 然 后 把 它 写 回 。 
这 样 原来 是 TS 密级 的 数据 大 家 都 可 以 读 到 了 ,造成 了 TS 密级 数据 的 泄漏 。 


图 6-5 主体 存 取 客 体 的 条 件 
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强制 存 取 控 制 是 对 数据 本 身 进行 密级 标记 ,无 论 数据 如 何 SQL 语法 分 析 & 语 义 从 查 
复制 ,标记 与 数据 是 一 个 不 可 分 的 整体 ,只 有 符合 密级 标记 要 | 


求 的 用 户 才 可 以 操纵 数据 ,从 而 提供 了 更 高 级 别 的 安全 性 。 DAC 伦 查 
由 于 较 高 安全 性 级 别提 供 的 安全 保护 要 包含 较 低级 别 的 “安全 检查 | | 

所 有 保护 ,因此 在 实现 MAC 时 要 首先 实现 DAC, 即 DAC 与 

MAC 共同 构成 DBMS 的 安全 机 制 ,如 图 6-6 所 示 。 系 统 首先 j 

进行 DAC 检查 ,对 通过 DAC 检查 的 允许 存 取 的 数据 对 象 再 由 继续 请 义 检查 

系统 自动 进行 MAC 检查 ,只 有 通过 MAC 检查 的 数据 对 象 方 


- 图 6-6 DAC+MAC 安全 
可 存 取 。 检查 示意 图 
强制 存 取 控 制 的 特点 : 比较 严格 、 安 全 。 


6.3 视图 机 制 


通过 之 前 的 介绍 了 解 到 ,视图 是 作用 于 一 个 或 多 个 基本 表 的 运算 的 动态 结果 ,是 一 个 虚 
表 , 在 数据 库 中 并 不 实际 存在 , 它 根 据 某 个 用 户 的 请 求 并 在 请 求 的 那 一 刻 才 通过 计算 产生 。 

视图 机 制 可 以 为 不 同 的 用 户 定义 不 同 的 视图 ,这 样 可 以 向 某 些 用 户 隐藏 数据 库 的 一 部 
分 信息 ,并 且 用 户 不 会 知道 未 在 视图 中 出 现 的 任何 属性 或 元 组 是 否 存在 , 即 把 数据 对 象限 制 
在 一 定 的 范围 内 。 也 就 是 说 , 当 用 户 被 授予 适当 的 权限 后 就 可 以 使 用 视图 ,具有 对 视图 使 用 
权限 的 用 户 只 能 访问 该 视图 而 不 能 访问 视图 所 依赖 的 基本 表 。 通 过 视图 机 制 把 要 保密 的 数 
据 对 无 权 存 取 的 用 户 隐藏 起 来 ,这 样 一 来 ,使 用 视图 机 制 就 比 简单 地 将 基本 表 的 使 用 权 授 予 
用 户 更 具有 限制 性 ,从 而 更 加 安全 。 

视图 机 制 间 接地 实现 支持 存 取 谓词 的 用 户 权 限定 义 。 通 过 为 不 同 的 用 户 定义 不 同 的 视 
图 ,可 以 限制 各 个 用 户 的 访问 范围 。 例 如 ,在 学 校 中 假定 Ul 只 能 检索 计算 机 系 学 生 的 信 
息 , 系 主任 U2 具有 检索 和 增删 改 计算 机 系 学 生 信息 的 所 有 权限 。 这 就 要 求 系统 能 支持 “ 存 
取 谓 词 ”的 用 户 权限 定义 。 在 不 直接 支持 存 取 谓 词 的 系统 中 ,可 以 先 建立 计算 机 系 学 生 的 视 
图 CS_Student, 然 后 在 视图 上 进一步 定义 存 取 权限 。 

【 例 18】 建立 计算 机 系 学 生 的 视图 ,把 对 该 视图 的 SELECT 权限 授予 U1, 把 该 视图 
的 所 有 操作 权限 授予 U2。 

CREATE VIEW CS_Student 

RS 

SELECT * 


FROM Student 
WHERE Sdep = 'CS' 


GRANT SELECT 
ON CS Student 
TO Ul; 


解 题 说 明 : Ul 只 能 检索 计算 机 系 学 生 的 信息 。 


GRANT ALL PRIVILEGES 
ON CS Student 


TO U2; 


解 题 说 明 : 
系 主任 U2 具有 检索 和 增删 改 计算 机 系 学 生 信息 的 所 有 权限 。 


6.4 审 计 


前 面 介绍 的 用 户 身 份 鉴别 、 存 取 控 制 以 及 视图 机 制 都 是 数据 库 安全 保护 的 重要 技术 ( 安 
全 策略 方面 ) ,但 不 是 全 部 。 为 了 使 数据 库 管理 系统 达到 一 定 的 安全 级 别 , 还 需要 在 其 他 方 
面 提供 相应 的 支持 。 例 如 按照 TDI/TCSEC 标准 中 安全 策略 的 要 求 ,审计 功能 就 是 数据 库 
管理 系统 达到 C2 以 上 安全 级 别 必 不 可 少 的 一 项 指标 。 

因为 任何 系统 的 安全 保护 措施 都 不 是 完美 无 缺 的 ,蓄意 盗窃 .破坏 数据 的 人 总 是 想 方 设 
法 打破 控制 ,而 审计 跟踪 (Audit Trail) 是 一 种 监视 措施 。 数 据 库 在 运行 中 ,DBMS 跟踪 用 户 
对 一 些 敏 感性 数据 的 存 取 活 动 , 审 计 功 能 把 用 户 对 数据 库 的 所 有 操作 自动 记录 下 来 放 入 审 
计 日 志 (Audit Log) 文 件 中 。 一 旦 发 现 有 窃取 或 破坏 数据 库 的 企图 ,有 的 DBMS 会 发 出 警 
报信 息 , 多 数 DBMS 虽 无 警报 功能 ,审计 员 可 以 利用 审计 日 志 监 控 数据 库 中 的 各 种 行为 , 重 
现 导致 数据 库 现 有 状况 的 一 系列 事件 , 找 出 非法 存 取 数据 的 人 、 时 间 和 内 容 等 , 找 出 原因 ,和 追 
究 责任 。 还 可 以 通过 对 审计 日 志 分 析 , 对 潜在 的 威胁 提前 采取 措施 加 以 防范 。 跟 踪 审 计 由 
DBA 控制 ,或 者 由 数据 的 属 主 控制 。 

审计 通常 是 很 费时 间 和 空间 的 ,所 以 数据 库 管 理 系 统 往往 都 将 审计 设置 为 可 选 特征 ,多 
许 数据 库 管理 员 根 据 具 体 应 用 对 安全 性 的 要 求 灵 活 地 打开 或 关闭 审计 功能 。 审 计 功能 主要 
用 于 安全 性 要 求 较 高 的 部 门 。 

1. 审计 跟踪 日 志文 件 记录 内 容 

审计 跟踪 日 志文 件 记录 一 般 包括 下 列 内 容 : 

请 求 ( 源 文本 ); 

操作 类 型 (例如 修改 、 查 询 等 ); 

操作 终端 标识 与 操作 者 标识 ; 

操作 日 期 和 时 间 ; 

所 涉及 的 数据 对 象 (如 表 、 视 图 .记录 、 属 性 等 ); 

数据 的 前 映像 和 后 映像 。 

审计 跟踪 在 几 个 方面 加 强 了 * 安 全 性 ”。 例 如 ,如 果 发 现 一 个 账户 的 余额 不 正确 ,银行 也 
许 会 跟踪 所 有 在 这 个 账户 上 的 更 新 来 找到 错误 ,同时 也 会 找到 执行 这 个 更 新 的 人 。 然 后 银 
行 就 可 利用 审计 跟踪 日 志文 件 跟踪 这 个 人 所 做 的 所 有 更 新 以 找到 其 他 错误 。 

审计 跟踪 可 通过 在 关系 更 新 操作 上 定义 适当 的 触发 器 来 实现 ,也 可 利用 数据 库 系 统 提 
供 的 内 置 机 制 来 实现 。 

2. 审计 功能 的 设置 与 取消 

利用 AUDIT 语句 和 NOAUDIT 语句 来 设计 审计 功能 和 取消 审计 功能 。 

审计 一 般 可 以 分 为 用 户 级 审计 和 系统 级 审计 。 用 户 级 审计 是 任何 用 户 都 可 设置 的 审 
计 , 主 要 是 用 户 针对 自己 创建 的 数据 库 表 或 视图 进行 审计 ,记录 所 有 用 户 对 这 些 表 或 视图 的 
一 切 成 功 和 (或 ) 不 成 功 的 访问 要 求 以 及 各 种 类 型 的 SQL 操作 。 
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系统 级 审计 只 能 由 数据 库 管理 员 设置 ,用 以 监测 成 功 或 失败 的 登录 要 求 ,监测 授权 和 收 
回 操作 以 及 其 他 数据 库 级 权限 下 的 操作 。 
【 例 19】 对 修改 SC 表 结构 或 修改 SC 表 数 据 的 操作 进行 审计 。 


RUDIT ALTER, UPDATE 
ON SC; 


【 例 20】 取消 对 SC 表 的 一 切 审 计 。 


NOAUDIT ALTER, UPDATE 

ON SC; 

审计 设置 以 及 审计 日 志 一 般 都 存储 在 数据 字典 中 。 必 须 把 审计 开关 打开 ( 即 把 系统 参 
数 Audit_trail 设 为 true) , 才 可 以 在 系统 表 SYS_AUDITTRAIL 中 查看 到 审计 信息 。 

数据 库 安全 审计 系统 提供 了 一 种 事后 检查 的 安全 机 制 。 安 全 审计 机 制 将 特定 用 户 或 者 
特定 对 象 相关 的 操作 记录 到 系统 审计 日 志 中 ,作为 后 续 对 操作 的 查询 分 析 和 追踪 的 依据 。 

通过 审计 机 制 ,可 以 约束 用 户 可 能 的 恶意 操作 。 


6.5 数据 加 密 


对 于 高 度 敏感 性 数据 ,例如 国家 机 密 、 军 事 数据 、 财 务 数据 , 除 以 上 安全 性 措施 外 还 可 以 
采用 数据 加 密 技术 。 以 密 文 形式 存储 和 传输 数据 。 

数据 加 密 是 防止 数据 库 中 数据 在 存储 和 传输 中 失 密 的 有 效 手段 。 加 密 的 基本 思想 是 根 
据 一 定 的 算法 将 原始 数据 (术语 为 明文 ,Plain Text) 变 换 为 不 可 直接 识别 的 格式 (术语 为 密 
文 ,Cipher Text)。 这 样 如 果 企 图 通过 不 正常 渠道 获取 数据 ,例如 利用 系统 安全 措施 的 漏洞 
非法 访问 数据 或 者 在 通信 线路 上 窃取 数据 ,那么 只 能 看 到 一 些 无 法 辨认 的 二 进 制 代码 ( 密 
文 )。 用 户 正常 检索 数据 时 ,首先 要 提供 密码 钥匙 ,由 系统 进行 译 码 后 ,才能 得 到 可 识别 的 数 
据 ( 明 文 ) 。 

另外 ,所 有 提供 加 密 机 制 的 系统 必然 也 提供 相应 的 解密 程序 。 这 些 解 密 程序 本 身 也 必 
须 具 有 一 定 的 安全 性 保护 措施 ,否则 数据 加 密 的 优点 也 就 遗失 列 尽 了 。 

加 密 方法 主要 有 两 种 : 一 种 是 蔡 换 方法 ,该 方法 使 用 密 钥 (Encryption Key) 将 明文 中 每 
一 个 字符 转换 为 密 文中 的 一 个 字符 ; 另 一 种 是 置换 方法 ,该 方法 仅 将 明文 的 字符 按 不 同 的 
顺序 重新 排列 。 单 独 使 用 这 两 种 方法 的 任意 一 种 都 是 不 够 安全 的 。 但 是 将 这 两 种 方法 结合 
起 来 就 能 提供 相当 高 的 安全 程度 。 采 用 这 种 结合 算法 的 例子 是 美国 国家 数据 加 密 标准 
(Data Encryption Standard,DES) 。 

目前 有 些 数据 库 产品 提供 了 数据 加 密 例 行 程序 ,可 根据 用 户 的 要 求 自动 对 存储 和 传输 
的 数据 进行 加 密 处 理 。 另 一 些 数据 库 产品 虽然 本 身 未 提供 加 密 程序 ,但 提供 了 接口 ,允许 用 
户 用 其 他 厂商 的 加 密 程 序 对 数据 加 密 。 

与 审计 一 样 ,数据 加 密 也 是 比较 费时 的 操作 ,而 且 数 据 加 密 、 解 密 程序 也 会 占用 大 量 系 
统 资源 ,增加 了 系统 的 开销 ,影响 了 系统 查询 的 效率 。 因 此 DBMS 通常 将 数据 加 密 功 能 作 
为 可 选 特征 ,允许 DBA 根据 应 用 对 安全 性 的 要 求 ,灵活 地 打开 或 关闭 其 功能 ,允许 用 户 选 
择 对 高 度 机 密 的 数据 加 密 。 跟 踪 审 计 与 数据 加 密 技术 一 般 用 于 安全 性 要 求 较 高 的 数据 库 


系统 。 
有 关 加 密 技 术 及 密 钥 管理 问题 等 已 超出 本 书 范围 ,这 里 不 再 讨论 。 


6.6 小 结 


数据 库 的 安全 性 是 指 保护 数据 以 防止 非法 使 用 造成 的 数据 泄密 、 更 改 和 破坏 。 数 据 库 
的 安全 管理 涉及 用 户 的 访问 权限 问题 ,通过 设置 用 户 标识 、 用 户 的 存 取 控制 权限 、 定 义 视图 、 
数据 加 密 等 技术 来 保证 数据 不 被 非法 使 用 。 

三 种 常用 的 存 取 控 制 方法 是 自主 存 取 控制 强制 存 取 控 制 基 于 角色 存 取 控制 。 自 主 存 
取 控 制 的 实施 主要 通过 授权 来 进行 。 

随 着 数据 库 应 用 的 深入 和 计算 机 网 络 的 发 展 ,数据 的 共享 日 益 加 强 , 数 据 的 安全 保密 越 
来 越 重要 ,数据 库 管理 系统 是 管理 数据 的 核心 ,因而 其 自身 必须 具有 一 整套 完整 而 有 效 的 安 
全 性 机 制 。 


习 题 


. 什么 是 数据 库 的 安全 性 ? 数据库 安 全 性 控制 的 常用 方法 有 哪些 ? 
. 数据库 安全 性 和 计算 机 系统 的 安全 性 有 什么 关系 ? 
.什么 是 数据 库 中 的 自主 存 取 控制 方法 和 强制 存 取 控 制 方法 ? 

. 试 述 信息 安全 标准 的 发 展 历史 , 试 述 CC 评估 保证 级 划分 的 基本 内 容 。 
. 什么 是 数据 库 的 审计 功能 ,为 什么 要 提供 审计 功能 ? 

. 举例 说 明 强 制 存 取 控 制 机 制 是 如 何 确定 主体 能 否 存 取 客 体 的 。 

.对 于 下 面 的 两 个 关系 模式 : 

Student (Sno, Sname, Sage, Ssex, Sdept) (学 号 , 姓名, 年龄, 性别, 所属 学 院 ) 
Class(Cno, Cname, Cmonitor) (班级 号 ,班级 名 ,班长 ) 

使 用 GRANT 语句 完成 下 列 授权 功能 。 

(1) 授予 用 户 U1 对 两 个 表 的 所 有 权限 ,并 可 给 其 他 用 户 授 权 。 

(2) 授予 用 户 U2 对 学 生 表 具有 查看 权限 ,对 所 属 学 院 具 有 更 新 权限 。 
(3) 将 对 班级 表 查 看 权限 授予 所 有 用 户 。 

(4) 将 对 学 生 表 的 查询 .更 新 权限 授予 角色 R1。 

(5) 将 角色 R1 授予 用 户 U1 ,并 且 U1 可 继续 授权 给 其 他 角色 。 

8. 针对 习题 8 中 (1) 一 (3) 的 每 一 种 情况 ,撤销 各 用 户 所 授予 的 权限 。 
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第 7 章 数据 库 的 完整 性 


【本 章 主要 内 容 】 

1. 简单 讨论 了 完整 性 的 基本 概念 及 完整 性 控制 机 制 。 

2. 重点 介绍 实体 完整 性 .参照 完整 性 及 用 户 定义 完整 性 的 定义 、 完 整 性 检查 以 及 违约 
处 理 。 

3. 简介 完整 性 约束 命名 子 句 .断言 的 定义 方法 以 及 触发 器 相关 知识 。 


数据 库 的 安全 性 和 完整 性 (Integrity) 是 两 个 不 同 的 概念 ,但 它们 之 间 还 存在 着 一 定 的 
联系 。 数 据 的 完整 性 是 为 了 防止 数据 库 中 存在 不 符合 语义 的 数据 ,也 就 是 防止 数据 库 中 存 
在 不 正确 的 数据 , 即 要 保证 数据 库 中 数据 的 正确 性 有 效 性 和 相 容 性 。 数 据 库 的 安全 性 是 指 
保护 数据 库 以 防止 不 合法 使 用 造成 的 数据 泄漏 、 更 改 或 破坏 。 完 整 性 检查 的 目的 是 防止 错 
误 数 据 进 入 数据 库 。 安 全 性 控制 的 防范 对 象 是 非法 用 户 和 非法 操作 ,防止 他 们 对 数据 库 数 
据 的 非法 存 取 。 

用 户 无 意 中 对 数据 库 造 成 破坏 ,导致 不 合 语义 的 数据 进入 系统 的 现象 是 不 可 避免 的 , 因 
此 数据 库 管 理 系统 必须 提供 一 种 机 制 ,来 保证 数据 库 中 的 数据 是 正确 且 符合 语义 的 ,这 就 是 
数据 库 完整 性 要 实现 的 功能 。 

完整 性 受到 破坏 的 常见 原因 有 错误 的 数据 、 错 误 的 更 新 操作 、 各 种 硬 软件 故障 、 并 发 访 
问 及 人 为 破坏 等 。 

为 维护 数据 库 的 完整 性 ,DBMS 必须 提供 一 种 机 制 来 检查 数据 库 中 的 数据 ,看 其 是 否 
满足 语义 规定 的 条 件 , 这 些 加 在 数据 库 数 据 之 上 的 语义 约束 条 件 称 为 数据 库 的 完整 性 约束 
条 件 ,它们 作为 模式 的 一 部 分 存 人 数据 字典 中 。DBMS 中 检查 数据 是 否 满足 完整 性 条 件 的 
机 制 称 为 完整 性 控制 机 制 。 

数据 库 的 完整 性 保障 是 DBMS 的 主要 功能 之 一 。 数据库 中 数据 应 满足 的 条 件 称 为 “ 完 
整 性 约束 条 件 ”, 也 称 * 完 整 性 约束 规则 ”。 而 检查 数据 库 中 数据 是 否 满足 完整 性 约束 条 件 的 
过 程 称 为 “完整 性 检查 ”。DBMS 中 执行 完整 性 检查 的 子 系统 称 为 “完整 性 子 系统 ”。 

完整 性 子 系统 ,负责 处 理 数据 库 的 完整 性 语义 约束 的 定义 和 检查 ,防止 因 错误 的 更 新 操 
作 产 生 的 不 一 致 性 。 用 户 可 以 使 用 完整 性 保护 机 制 , 对 某 些 数据 规定 一 些 语义 约束 。 当 进 
行 数据 操作 时 ,DBMS 就 由 某 个 完整 性 语义 约束 的 触发 条 件 激发 相应 的 检查 程序 ,进行 完 
整 性 语义 约束 检查 。 若 发 现 错误 的 更 新 操作 ,立即 采取 措施 处 理 , 或 是 拒绝 执行 该 更 新 操 
作 , 或 是 发 出 警告 信息 ,或 者 纠正 已 产生 的 错误 。 

鉴于 目前 大 多 数 商业 数据 库 产品 采用 关系 数据 模型 ,本 章 主 要 围绕 关系 数据 库 完整 性 
的 基本 概念 .完整 性 约束 和 完整 性 约束 的 分 类 展开 讨论 。 


7.1 完整 性 基本 概念 


数据 库 的 完整 性 包括 数据 库 的 正确 性 ` 有 效 性 和 相 容 性 。 

正确 性 : 指数 据 的 合法 性 ,是 否 能 符合 现实 世界 语义 、 反 映 当前 实际 状况 ; 如 学 生 的 学 
号 必须 唯一 ,性 别 只 能 是 男 或 女 。 

有 效 性 : 指数 据 要 属于 定义 域 的 有 效 范围 内 ,如 本 科学 生年 龄 的 取 值 范围 为 14~50 的 
整数 。 

相 容 性 : 指数 据 库 同一 对 象 在 不 同 关系 表 中 的 数据 是 符合 逻辑 的 。 即 同一 事物 的 两 个 
数据 应 该 一 致 ,不 一 致 即 为 不 相 容 。 学 生 所 选 的 课程 必须 是 学 校 开设 的 课程 ,学 生 所 在 的 院 
系 必须 是 学 校 已 成 立 的 院 系 等 。 

数据 库 管 理 系 统 必须 提供 一 种 功能 使 得 数据 库 中 的 数据 合法 ,以 确保 数据 的 正确 性 ; 
要 避免 不 符合 语义 的 错误 数据 的 输入 和 输出 ,以 确保 数据 的 有 效 性 ; 同时 还 要 检查 先后 输 
入 的 数据 是 否 一 致 ,以 确保 数据 的 相 容 性 。 

数据 是 否 具备 完整 性 关系 到 数据 库 系 统 能 否 真实 地 反映 现实 世界 ,因此 维护 数据 库 的 
完整 性 是 非常 重要 的 。 


7.2 完整 性 约束 


完整 性 约束 是 数据 库 中 用 来 确保 数据 的 正确 性 有效 性 和 相 容 性 的 方法 ,是 对 数据 的 正 


7.2.1 完整 性 约束 机 制 


数据 库 管理 系统 中 保障 数据 满足 完整 性 约束 条 件 的 机 制 称 为 完整 性 控制 机 制 ,完整 性 
控制 机 制 必 须 能 够 实现 以 下 功能 。 

(1) 定义 功能 , 即 提供 定义 完整 性 约束 条 件 的 机 制 。 

DBMS 要 提供 定义 完整 性 约束 条 件 的 功能 。 完 整 性 约束 条 件 也 称 为 完整 性 规则 ,完整 
性 约束 条 件 是 数据 库 中 的 数据 必须 满足 的 语义 约束 条 件 。 它 表达 了 给 定 的 数据 模型 中 数据 
及 其 联系 所 具有 的 制约 和 依存 规则 ,用 以 限定 符合 数据 模型 的 数据 库 状态 以 及 状态 的 变化 ， 
以 保证 数据 的 正确 有 效 和 相 容 。SQL 标准 使 用 了 一 系列 概念 来 描述 完整 性 ,包括 关系 模 
型 的 实体 完整 性 、 参 照 完整 性 和 用 户 定义 完整 性 。 

(2) 检查 功能 , 即 检查 用 户 发 出 的 操作 请 求 是 否 违背 了 完整 性 约束 条 件 。 

DBMS 中 检查 数据 是 否 满足 完整 性 约束 条 件 的 机 制 称 为 完整 性 检查 。 一 般 在 
INSERT UPDATE DELETE 语句 执行 后 开始 检查 ,也 可 以 在 事务 提交 时 检查 。 检 查 这 些 
操作 执行 后 数据 库 中 的 数据 是 否 违背 了 完整 性 约束 条 件 。 

(3) 违约 处 理 , 如 果 发 现 用 户 的 操作 请 求 使 数据 违背 了 完整 性 约束 条 件 , 则 采取 一 定 的 
措施 来 保证 数据 的 完整 性 。 如 拒绝 (NO ACTION) 执 行 操作 、 级 联 (CASCADE) 执 行 其 他 
操作 等 ,以 保证 数据 库 完整 性 。 
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7.2.2 完整 性 约束 条 件 分 类 


完整 件 约 东 条 件 可 以 从 作用 对 象 的 粒度 和 状态 两 个 方面 进行 分 类 ,在 关系 数据 库 中 , 完 
整 件 约 东 条 件 的 作用 对 象 可 分 为 属性 级 .元 组 级 和 关系 级 三 种 粒度 ,这 三 类 对 象 的 状态 可 以 
是 静态 的 ,也 可 以 是 动态 的 。 

静态 约 东 是 指数 据 库 中 每 一 确定 状态 时 的 数据 对 象 所 应 满足 的 约 东 条 件 , 它 是 反映 数 
据 库 状态 合理 性 的 约束 。 如 在 教务 教学 系统 中 ,学 生 的 成 绩 为 0 一 100; 动态 约 东 指数 据 库 
从 一 个 状态 变 为 另 一 个 状态 时 ,新 旧 值 应 该 满足 的 约束 条 件 。 如 图 书馆 管理 系统 中 ,读者 借 
书 数目 不 能 超过 其 能 够 借阅 的 图 书 总 数 。 

根据 以 上 两 个 方面 ,可 以 将 完整 性 约束 条 件 分 为 以 下 6 类 。 

(1) 静态 属性 级 约束 

静态 属性 级 约束 是 施加 于 单 属性 数据 上 的 约束 ,是 对 一 个 属性 的 取 值 域 的 说 明 , 它 主要 
包括 对 数据 类 型 的 约束 、 对 数据 格式 的 约束 、 对 取 值 范围 的 约束 及 对 于 空 值 的 约束 。 

。 数据 类 型 约束 : 如 某 个 属性 的 类 型 应 为 字符 串 、 整 型 或 者 浮 点 型 。 
数据 格式 约束 : 如 邮政 编码 为 6 位 数字 。 
取 值 范围 约束 : 如 学 生 可 借阅 图 书 的 数目 为 1 一 5 本 ,教师 可 借阅 图 书 的 数目 为 
1 一 10。 
空 值 约束 : 空 值 表示 未 定义 或 者 未 知 的 值 , 有 的 属性 可 以 为 空 ,而 有 的 属性 则 不 
可 以 。 

(2) 静态 元 组 级 约束 

静态 元 组 级 约束 是 施加 于 单个 关系 元 组 上 的 约束 , 它 规定 组 成 一 个 元 组 的 各 属性 之 间 
的 约束 关系 ,如 图 书库 存 数目 = 图 书 总 数 一 借 出 数目 。 

(3) 静态 关系 级 约束 

静态 关系 级 约束 是 施加 于 一 个 关系 的 各 个 元 组 或 者 不 同 关 系 之 间 的 约束 ,常见 的 静态 
关系 级 约束 有 以 下 几 种 。 

。 实体 完整 性 约束 指 关系 的 主 码 约 束 , 即 构成 关系 主 码 的 一 个 或 多 个 属性 的 取 值 不 能 
为 空 。 
参照 完整 性 约束 : 维护 关系 间 的 外 码 参 照 关系 不 被 破坏 。 
函数 依赖 约束 维护 用 户 规定 的 函数 依赖 。 如 用 户 定 义 了 函数 依赖 Name 一 Address， 
则 在 数据 库 中 ,一 个 用 户 只 能 保存 一 个 地 址 ,如 果 对 于 同一 个 姓名 插入 多 个 不 同 的 
地 址 ,系统 将 拒绝 执行 。 
统计 约束 : 指 一 个 关系 的 某 个 属性 值 与 该 关系 多 个 元 组 的 统计 值 之 间 的 关系 。 如 
经 理 的 工资 不 得 高 于 职工 的 平均 工资 ,教授 的 工资 必须 高 于 教工 的 平均 工资 等 等 。 
(4) 动态 属性 级 约束 
动态 属性 级 约束 指 修改 属性 定义 或 者 属性 值 时 应 该 满足 的 约束 条 件 。 
。 修改 定义 时 的 约束 : 例如 将 原来 允许 空 值 的 属性 列 改 为 不 允许 空 值 时 ,如 果 该 属性 

列 已 经 存在 空 值 , 则 拒绝 这 种 修改 。 
。 修改 属性 值 时 的 约束 : 修改 属性 值 有 时 需要 参考 修改 属性 的 旧 值 , 且 新 值 和 旧 值 之 
间 需 要 满足 某 种 约束 条 件 。 如 职工 的 工龄 只 能 增长 。 


(5) 动态 元 组 级 约束 

动态 元 组 级 约束 指 修改 某 个 元 组 的 值 时 要 参照 该 元 组 的 旧 值 , 且 新 值 和 旧 值 之 间 需 要 
满足 某 种 约束 条 件 。 例 如 ,职工 表 中 有 职称 和 工资 属性 ,规定 调整 工资 时 教授 的 工资 不 得 低 
于 10000 元 。 

(6) 动态 关系 级 约束 

动态 关系 级 约束 指 加 在 关系 变化 前 后 状态 上 的 限制 条 件 ,如 事务 的 一 致 性 、 原 子 性 等 约 
东 均 属于 动态 表 级 约束 。 

在 上 面 的 完整 性 约束 分 类 中 ,最 重要 的 约束 是 实体 完整 性 约束 和 参照 完整 性 约束 ,其 他 
约束 均 可 归 类 为 用 户 定义 完整 性 约束 。 因 此 ,多数 教 材 中 将 完整 性 约束 分 为 实体 完整 性 . 参 
照 完 整 性 .用户 定义 完整 性 三 大 类 。 在 后 面 的 章节 中 ,会 对 这 三 类 完整 性 进行 详细 介绍 。 


7.2.3 完整 性 约束 的 定义 方法 


现代 数据 库 技术 采用 对 数据 完整 性 的 语义 约束 和 检查 来 保护 数据 库 的 完整 性 ,其 实现 
方式 有 两 种 。 

声明 式 定 义 : 即 通 过 声明 的 方式 定义 完整 性 约束 条 件 ,例如 一 般 实体 完整 性 、 简 单 的 列 
定义 都 是 通过 这 种 方式 完成 的 。 

过 程式 定义 : 即 通 过 编写 特殊 的 程序 ,如 触发 器 (Trigger) 和 存储 过 程 (Stored 
Procedure) 来 定义 和 实现 完整 性 控制 。 关 于 触发 器 的 具体 内 容 ,将 在 7. 8 节 中 进行 详细 
介绍 。 

早期 的 数据 库 管理 系统 不 支持 完整 性 检查 ,因为 完整 性 检查 不 仅 费 时 而 且 浪 费 资源 。 
目前 商用 数据 库 管理 系统 都 支持 完整 性 控制 , 即 完整 性 定义 和 检查 控制 由 关系 数据 库 系统 
实现 ,而 不 必 由 应 用 程序 完成 ,以 减轻 程序 员 的 负担 。 更 重要 的 是 ,关系 数据 库 管 理 系 统 使 
得 完整 性 控制 成 为 其 核心 支持 的 功能 ,从 而 能 够 为 所 有 用 户 和 应 用 提供 一 致 的 数据 库 完整 
性 。 因 为 由 应 用 程序 来 实现 完整 性 控制 是 有 漏洞 的 ,有 的 应 用 程序 定义 的 完整 性 约束 条 件 
可 能 被 其 他 应 用 程序 破坏 ,数据 库 数据 的 正确 性 仍然 无 法 保障 。 

数据 是 否 具备 完整 性 关系 到 数据 库 系 统 能 否 真 实地 反映 现实 世界 ,因为 维护 数据 库 的 
完整 性 是 非常 重要 的 

在 2. 3 节 中 已 经 介绍 了 关系 数据 库 三 类 完整 性 约束 的 基本 概念 。 用 SQL 实现 完整 性 
约束 主要 分 三 类 : 通过 定义 主 码 实 现实 体 完整 性 ; 通过 定义 外 码 满 足 参 照 完 整 性 ; 通过 定 
义 域 约束 、 检 查 约束 和 断言 等 实现 用 户 定义 的 完整 性 。 接 下 来 将 介绍 SQL 语言 中 实现 这 些 
完整 性 控制 功能 的 方法 。 


7.3 实体 完整 性 


7.3.1 定义 实体 完整 性 


在 关系 模型 中 ,实体 完整 性 是 指 对 关系 中 码 的 约束 。 在 关系 中 , 码 用 来 唯一 标识 一 个 元 
组 ,因此 要 确保 码 不 重复 ,上 且 不 能 为 空 值 。 关 系 的 码 可 以 是 一 个 属性 ,也 可 以 是 一 组 属性 ,是 
一 组 属性 时 ,属性 组 中 的 任何 一 个 属性 都 不 能 取 空 值 。 在 SQL 中 , 码 在 创建 表 时 使 用 
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PRIMARY KEY 来 定义 。 定 义 码 有 两 种 方式 : 列 级 约束 条 件 和 表 级 约束 条 件 。 对 于 单 属 
性 组 成 的 码 , 上 述 两 种 方式 均 可 ; 而 对 于 由 多 属性 组 成 的 码 ,只 能 采用 表 级 约束 条 件 。 

关系 模型 的 实体 完整 性 在 CREATE TABLE 中 用 PRIMARY KEY 定义 。 实 体 完 整 性 
定义 示例 如 下 。 

【 例 1】 将 Student 表 中 的 Sno 属性 定义 为 码 。 

CREATE TABLE Student 

(Sno CHAR(9) PRIMARY KEY, /x* 在 列 级 定义 主 码 * / 

Sname CHAR (20) NOT NULL, 

Ssex CHAR (2), 

Sage SMALLINT, 

Sdept CHAR (20) 

)s 
或 者 

CREATE TABLE Student 

(Sno CHAR (9), 

Sname CHAR (20) NOT NULL, 

Ssex CHAR (2), 

Sage SMALLINT, 

Sdept CHAR (20), 

PRIMARY KEY (Sno) /x* 在 表 级 定义 主 码 * / 

) 

解 题 说 明 : 

例 中 将 Student 表 的 Sno 属性 定义 为 主 码 ,是 单 属 性 构成 的 主 码 ,可 以 采用 列 级 定义 和 
表 级 定义 两 种 方式 。 

【 例 2】 将 SC 表 中 的 Sno、Cno 属性 组 定义 为 码 。 

CREATE TABLE SC 

( Sno CHAR (9) NOT NULL, 

Cno CHAR (4) NOT NULL, 

Grade SMALLINT, 

PRIMARY KEY (Sno, Cno) /* 只 能 在 表 级 定义 主 码 * / 

) 

解 题 说 明 

例 中 将 SC 表 的 Sno 和 Cno 属性 组 定义 为 主 码 ,是 属性 组 构成 的 主 码 ,只 能 采用 表 级 定 
义 的 方式 。 


7.3.2 实体 完整 性 检查 和 违约 处 理 


关系 中 定义 了 主 码 之 后 , 当 在 表 中 插入 一 个 元 组 或 对 某 个 元 组 的 主 码 进行 修改 时 ,都 会 
自动 进行 实体 完整 性 检查 ,检查 的 内 容 包 括 : 

(1) 检查 要 插入 或 修改 的 元 组 的 主 码 在 表 中 是 否 已 经 存在 ,如 存在 则 拒绝 插入 或 修改 ; 

(2) 检查 主 码 的 各 个 属性 是 否 为 NULL. 主 码 中 的 任 一 属性 为 NULL 都 应 拒绝 插入 或 
修改 。 


检查 元 组 中 的 主 码 是 否 唯一 的 一 种 方法 是 进行 全 表 扫 描 , 依 次 判断 表 中 每 个 元 组 的 主 
码 与 将 要 插入 或 修改 的 元 组 主 码 是 否 相 同 ,如 图 7-1 所 示 。 


待 插入 记录 
Keyi F2i F3i F4i FSi 
ee 基本 表 
Keyl F21 F31 F41 F5l 
Key2 F22 F32 F42 F52 
Key3 F23 F33 F43 F53 


图 7-1 用 全 表 扫 描 方法 检查 主 码 唯一 性 


但 全 表 扫 描 的 系统 开销 很 大 ,因此 数据 库 管理 系统 中 一 般 都 在 主 码 上 自动 建立 索引 , 通 
过 索引 查找 表 中 是 否 有 重复 的 主 码 ,大 大 提高 了 查找 的 效率 。 如 图 7-2 的 B 十 树 索引 ,通过 
索引 查找 基本 表 中 是 否 已 经 存在 新 的 主 码 值 将 大 大 提高 效率 。 例 如 ,如 果 新 插入 记录 的 主 
码 值 是 25 ,通过 主 码 索引 ,从 B 十 树 的 根 节点 开始 查找 ,只 要 读 取 三 个 节点 就 可 以 知道 该 主 
码 值 已 经 存在 ,所 以 不 能 插入 这 条 记录 。 这 三 个 节点 是 根 节点 (51) .中 间 节 点 (12 30) 和 叶 
节点 (15 20 25)。 如 果 新 插入 记录 的 主 码 值 是 86, 也 只 要 查找 三 个 节点 就 可 以 知道 该 主 码 
值 不 存在 ,所 以 可 以 插入 该 记录 。 


新 记录 的 主 码 值 


FE 15 20 25 30 41 51 54 65 68 69 71 76 79 84 93 


图 7-2 使 用 索引 检查 主 码 唯 一 


7.4 参照 完整 性 


7.4.1 参照 完整 性 定义 


在 关系 模型 中 ,参照 完整 性 是 相关 联 的 两 个 或 两 个 以 上 表 之 间 的 约束 。 如 果 属 性 或 属 
性 组 FF 是 基本 关系 及 的 外 码 , 它 与 基本 关系 S 的 主 码 Ks 相对 应 (RS 不 一 定 是 两 个 不 同 的 
关系 ), 则 对 于 R 中 某 个 元 组 ,在 F 上 的 取 值 应 满足 : 

@ 或 者 取 空 值 , 即 下 的 每 个 属性 值 均 为 空 值 ; 

@ 或 者 为 S 中 某 个 元 组 的 主 码 值 。 
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这 里 将 R 称 为 参照 关系 (Referencing Relation),S 称 为 被 参照 关系 (Referenced 
Relation) 。 

具体 地 说 ,就 是 参照 关系 中 每 个 元 组 外 码 的 值 要 么 是 被 参照 关系 中 存在 的 ,要 么 为 空 。 
因此 ,如 果 在 两 个 表 之 间 建 立 了 关联 关系 , 则 对 一 个 关系 进行 的 操作 要 影响 到 另 一 个 表 中 的 
元 组 。 在 SQL 中 ,关系 模型 的 参照 完整 性 在 CREATE TABLE 中 用 FOREIGN KEY 短语 
定义 哪些 列 为 外 码 , 用 REFERENCES 短语 指明 这 些 外 码 参 照 哪些 表 的 主 码 。 与 实体 完整 
性 中 主 码 的 定义 类 似 , 外 码 的 定义 也 有 两 种 方式 : 列 级 定义 和 表 级 定义 。 参 照 完 整 性 定义 
示例 如 下 。 

【 例 3】 定义 SC 中 的 参照 完整 性 (关系 SC 中 一 个 元 组 表示 一 个 学 生 选 修 的 某 门 课程 
的 成 绩 ,(Sno,Cno) 是 主 码 ,Sno、Cno 分 别 参照 引用 Student 表 的 主 码 和 Course 表 的 主 码 ) 。 


CREATE TABLE SC 
(Sno CHAR (9) FOREIGN KEY(Sno) REFERENCES Student(Sno)， /* 在 列 级 定义 参照 完整 性 * / 


Cno CHAR (4) ， 
Grade SMALLINT, 
PRIMARY KEY (Sno, Cno), /* 在 表 级 定义 实体 完整 性 * / 
FOREIGN KEY(Cno) REFERENCES Course(Cno) /x* 在 表 级 定义 参照 完整 性 x* / 
); 

解 题 说 明 : 


例 中 定义 SC 表 中 的 参照 完整 性 中 ,SC 是 参照 关系 ,Student 和 Course 是 被 参照 关系 ， 
参照 关系 如 图 7-3 所 示 ; 参照 关系 Sno 采用 的 是 列 级 定义 ,而 Cno 采用 的 是 表 级 定义 ,这 两 
种 方式 都 是 可 以 的 。 


被 参照 关系 Student | 参 昭 关系 SC = co | 被 参照 关系 Course 


图 7-3 参照 关 系 与 被 参照 关系 


7.4.2 参照 完整 性 检查 和 违约 处 理 

参照 完整 性 将 两 个 表 中 相应 的 元 组 联系 起 来 了 .参照 表 中 的 某 一 属性 参照 被 参照 表 中 
的 主 码 进行 验证 ,因此 对 参照 表 和 被 参照 表 进行 插入 、 删 除 和 修改 都 有 可 能 破坏 参照 完 
性 ,都 必须 进行 检查 以 保证 这 两 个 表 的 相 容 性 。 以 Student 表 和 SC 表 为 例 ,如 表 7-1 所 示 ， 
对 表 Student 和 表 SC 有 4 种 情况 可 能 破坏 参照 完整 性 。 


表 7-1 可 能 破坏 参照 完整 性 的 情况 及 违约 处 理 


被 参照 表 ( 例 如 Student) 参照 表 ( 例 如 SC) 违约 处 理 

可 能 破坏 参照 完整 性 = 插入 元 组 拒绝 

可 能 破坏 参照 完整 性 = 修改 外 码 值 拒绝 

删除 元 组 < 全 可 能 破坏 参照 完整 性 拒绝 /级 联 删除 /设置 为 空 值 
修改 主 码 值 一 可 能 破坏 参照 完整 性 拒绝 /级 联 删除 /设置 为 空 值 


(1) 在 SC 表 中 增加 一 个 元 组 ,该 元 组 的 Sno 属性 的 值 与 Student 表 中 任意 一 个 元 组 的 
Sno 属性 都 不 相同 。 


(2) 修改 SC 表 中 的 一 个 元 组 ,修改 后 该 元 组 的 Sno 属性 的 值 与 Student 表 中 任意 一 个 
元 组 的 Sno 属性 都 不 相同 。 

(3) 从 Student 表 中 删除 一 个 元 组 ,造成 SC 表 中 存在 一 个 或 多 个 元 组 ,其 Sno 属性 的 
值 与 Student 表 中 任意 一 个 元 组 的 Sno 属性 都 不 相同 。 

(4) 修改 Student 表 中 一 个 元 组 的 Sno 属性 ,造成 SC 表 中 存在 一 个 或 多 个 元 组 ,其 
Sno 属性 的 值 与 Student 表 中 任意 一 个 元 组 的 Sno 属性 都 不 相同 。 

上 述 任何 一 种 情况 发 生 时 ,都 违反 了 参照 完整 性 ,系统 都 应 做 出 相应 的 处 理 。 处 理 的 方 
式 有 如 下 4 种 。 

(1) 拒绝 执行 (NO ACTION) 

不 允许 执行 该 操作 ,在 未 给 出 显 式 说 明 的 情况 下 ,系统 默认 采用 拒绝 执行 的 处 理 方式 。 

(2) 级 联 执行 (CASCADE) 

当 删 除 或 修改 被 参照 表 中 (在 此 为 Student 表 ) 的 元 组 违反 了 参照 完整 性 时 ,级 联 删除 
或 修改 参照 表 中 (在 此 为 SC 表 ) 所 有 不 一 致 的 元 组 ,例如 ,删除 Student 表 中 Sno 值 为 
“1703070101” 的 元 组 , 则 从 要 SC 表 中 级 联 删除 SC. Sno='1703070101' 的 所 有 元 组 。 

(3) 设置 为 空 值 方式 

当 删 除 或 修改 被 参照 表 中 的 元 组 违反 了 参照 完整 性 时 ,将 参照 表 中 所 有 不 一 致 元 组 的 
对 应 属性 设置 为 NULL。 

例如 ,有 下 面 两 个 关系 : 

Student( Sno, Sname, Ssex, Mcode, Sage) (学 生 关系 ) 

Major(Mcode, Mname) (专业 关系 ) 

在 上 述 两 个 关系 模式 中 , 表 Student 中 的 Mcode( 专 业 代 码 ) 属 性 参照 表 Major 中 的 
Mcode 属性 ,因为 Mcode 属性 是 Major 关系 的 主 码 , 所 以 学 生 关 系 的 “Mcode”" 属 性 是 外 码 。 
假设 删除 Major 表 中 的 某 个 专业 ,该 专业 的 Mcode 的 值 为 *1”( 即 1 专业 ) ,按照 设置 为 空 值 
方式 ,Student 表 中 所 有 Mcode 王 '1' 的 元 组 的 Mcode 属性 将 被 设置 为 NULL, 即 原来 1 专业 
学 生 处 于 等 待 分 配 专业 的 状态 。 并 表达 了 这 样 的 语义 : 1 专业 删除 了 ,该 专业 的 所 有 学 生 
的 专业 未 定 , 等 待 重 新 分 配 专业 。 

(4) 设置 默认 值 方式 

与 设置 为 空 值 方式 类 似 , 只 是 将 外 码 值 设 置 为 预先 定义 好 的 默认 值 。 

对 于 上 面 的 4 种 处 理 方式 ,给 出 如 下 几 点 说 明 。 

(1) 在 创建 表 时 未 给 出 显 式 定义 的 情况 下 ,系统 默认 采用 拒绝 执行 的 方式 保证 参照 完 
整 性 。 

(2) 对 于 设置 为 空 值 方式 ,并 不 是 所 有 的 情况 都 适用 。 下 面 讲 解 一 下 外 码 能 和 否 接受 空 
值 的 两 种 情况 。 

@ 学 生 表 中 “专业 号 ?是 外 码 ,按照 应 用 的 实际 情况 可 以 取 空 值 ,表示 这 个 学 生 的 专业 
尚未 确定 。 

@ 但 在 学 生 -选课 数据 库 管理 系统 中 ,关系 Student 为 被 参照 关系 ,其 主 码 为 Sno; SC 
为 参照 关系 ,Sno 为 外 码 , 它 能 香 取 空 值 呢 ? 答案 是 否定 的 。 可 以 举例 来 说 明 这 个 问题 。 

现在 从 Student 表 中 删除 某 个 学 生 , 如 果 采 用 设置 为 空 值 方式 , 则 SC 表 中 会 出 现 Sno 
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为 NULL 的 元 组 ,表示 尚 不 存在 的 某 个 学 生 ,或 者 某 个 不 知道 学 号 的 学 生 选 修了 某 门 课程 ， 
其 成 绩 记 录 在 Grade 列 中 ,这 与 学 校 的 实际 应 用 环境 不 符 。 这 是 因为 Sno 为 SC 的 主 属性 ， 
按照 实体 完整 性 SC 的 Sno 属性 列 不 能 取 空 值 。 同 样 ,SC 的 Cno 是 外 码 , 也 是 SC 的 主 属 
性 ,也 不 能 取 空 值 。 

因此 对 于 参照 完整 性 ,除了 应 该 定义 外 码 ,还 应 定义 外 码 属性 是 否 允 许 空 值 。 

(3) 对 于 同一 属性 的 修改 和 删除 操作 ,可 以 分 别 采 用 不 同 的 策略 ,如 删除 采用 拒绝 执行 
的 方式 ,而 修改 采用 级 联 执行 的 方式 。 

一 般 地 , 当 对 参照 表 和 被 参照 表 的 操作 违反 了 参照 完整 性 时 ,系统 选用 默认 策略 , 即 拒 
绝 执行 。 如 果 想 让 系统 采用 其 他 策略 则 必须 在 创建 参照 表 时 显 式 地 加 以 说 明 。 下 面 看 一 个 
现实 定义 操作 完整 性 的 例题 。 

【 例 4】 显 式 说 明 参 照 完整 性 的 违约 处 理 示 例 。 


CREATE TABLE SC 
( Sno CHAR (9) NOT NULL, 
Cno CHAR (4) NOT NULL, 
Grade SMALLINT, 
PRIMARY KEY( Sno, Cno) ， /x* 在 表 级 定义 实体 完整 性 , Sno .Cno 都 不 能 取 空 值 * / 
FOREIGN KEY( Sno) REFERENCES Student(Sno) /* 在 表 级 定义 参照 完整 性 * / 
ON DELETE CASCADE 
/* 当 删 除 Student 表 中 的 元 组 时 ,级 联 删除 Sc 表 中 相应 的 元 组 * / 
ON UPDATE CASCADE, 
/* 当 更 新 Student 表 中 的 Sno 时 ,级 联 更 新 SC 表 中 相应 的 元 组 * / 
FOREIGN KEY (Cno) REFERENCES Course (Cno) /* 在 表 级 定义 参照 完整 性 * / 
ON DELETE NO ACTION 
/* 删除 Course 表 中 的 元 组 造成 与 SC 表 不 一 致 时 ,拒绝 删除 * / 
ON UPDATE CRSCRDE 
/* 当 更 新 Course 表 中 的 Cno 时 ,级 联 更 新 SC 表 中 相应 的 元 组 * / 


) 

解 题 说 明 : 

从 例 中 可 以 看 出 ,Sno 和 Cno 都 定义 为 NOT NULL, 因 此 不 能 对 这 两 个 属性 进行 设置 
为 空 值 操作 ; 对 DELETE 和 UPDATE 可 以 采用 不 同 的 策略 。 当 删除 被 参照 表 Student 表 
中 的 元 组 ,造成 与 参照 表 (SC 表 ) 不 一 致 时 ,级 联 删 除 SC 表 中 相应 的 元 组 ; 而 对 更 新 操作 也 
采取 级 联 更 新 的 策略 。 当 删除 被 参照 表 Course 表 中 的 元 组 ,造成 与 参照 表 (SC 表 ) 不 一 致 
时 ,拒绝 删除 被 参照 表 的 元 组 ; 而 对 更 新 操作 采取 级 联 更 新 的 策略 。 

从 上 面 的 讨论 可 以 了 解 ,关系 数据 库 管 理 系 统 在 实现 参照 完整 性 时 ,除了 要 提供 定义 主 
码 、 外 码 的 机 制 外 ,还 需要 提供 不 同 的 策略 供用 户 选 择 。 具 体 选择 哪 种 策略 ,要 根据 应 用 环 
境 的 要 求 确定 。 


7.5 用 户 定义 的 完整 性 
在 关系 模型 中 ,用 户 定义 完整 性 是 指针 对 某 一 具体 应 用 ,数据 必须 满足 用 户 的 某 种 语义 


要 求 。 目 前 的 关系 数据 库 管理 系统 都 提供 了 定义 和 检验 这 类 完整 性 的 机 制 。 用 户 定义 完整 
人 性 根据 对 象 粒度 不 同 ,可 分 为 属性 上 约束 条 件 的 定义 和 元 组 上 约束 条 件 的 定义 。 


7.5.1 属性 上 的 约束 条 件 
1. 属性 上 约束 条 件 的 定义 
在 创建 表 的 时 候 即 可 根据 用 户 需 要 ,定义 属性 上 的 约束 条 件 ,包括 以 下 几 种 情况 。 
。 列 值 非 空 NOT NULL) 
。 列 值 唯一 (UNIQUE) 
。 检查 列 值 是 否 满足 一 个 条 件 表达 式 (CHECK 短语 )。 
(1) 不 允许 取 空 值 
【 例 S】 在 定义 SC 表 时 ,说 明 Sno、Cno、Grade 属性 不 允许 取 空 值 。 


CREATE TABLE SC 


(Sno CHAR(9) NOT NULL, /* Sno 属性 不 允许 取 空 值 * / 
Cno CHAR(4) NOT NULL, /* Cno 属性 不 允许 取 空 值 * / 
/* Grade 属性 不 允许 取 空 值 * / 


Grade SMALLINT NOT NULL, 
PRIMARY KEY( Sno, Cno) 
); 

解 题 说 明 : 

该 例 在 表 级 定义 实体 完整 性 , 隐 含 了 Sno、Cno 不 允许 取 空 值 ,在 列 级 不 允许 取 空 值 的 

定义 可 不 写 。 
(2) 列 值 唯一 
【 例 6】 建立 部 门 表 DEPT, 要 求 部 门 名 称 Dname 列 取 值 唯一 ,部 门 编号 Deptno 列 为 


主 码 。 


CREATE TABLE DEPT 

( Deptno NUMERIC (2), 

Dname CHAR(9) UNIQUE NOT NULL, 

Location CHAR (10), 

PRIMARY KEY (Deptno) 

); 

解 题 说 明 : 

该 题 的 属性 Dname 的 值 唯一 , 且 不 能 取 空 值 。 

(3) 用 CHECK 短语 指定 列 值 应 该 满足 的 条 件 

【 例 7】 创建 Student 表 , 要 求学 生 的 性 别 只 能 取 男 或 女 ,学生 的 年 龄 为 10 一 50 岁 。 


/* 在 表 级 定义 实体 完整 性 * / 


CREATE TABLE Student 


(Sno VARCHAR (20 ) PRIMARY KEY, 
Sname VARCHAR (40) NOT NULL, /* Sname 属性 不 允许 取 空 值 * / 


Ssex CHAR ( 2 ) CHECK(Ssex IN (' 男 ', ' 女 ') )， /* 性 别 属性 Ssex 只 允许 取 ' 男 ' 或 ' 女 '*/ 
Sage SMALLINT CHECK (Sage> = 10 AND Sage< =50 ) /* 年 龄 属性 Sage 为 10 一 50* / 

) 

2. 属性 上 约束 条 件 的 检查 和 违约 处 理 

当 向 表 中 插入 元 组 或 修改 属性 的 值 时 ,关系 数据 库 管 理 系 统 将 检查 属性 上 的 约束 条 件 


是 否 被 满足 ,如 果 不 满足 则 操作 被 拒绝 执行 。 


/* 在 列 级 定义 主 码 * / 


地 N 由 
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7.5.2 元 组 上 的 约束 条 件 


1. 元 组 上 约束 条 件 的 定义 
与 属性 上 约束 条 件 的 定义 类 似 , 在 创建 表 的 时 候 , 可 以 用 CHECK 语句 定义 元 组 上 的 
约束 条 件 。 与 属性 上 的 约束 条 件 相 比 ,元 组 上 的 约束 条 件 可 以 设置 不 同属 性 取 值 间 的 相互 
约束 关系 。 
【 例 8〗 当 学 生 的 性 别 是 男 时 ,其 名 字 不 能 以 “Ms. "开头 。 
CREATE TABLE Student 
( Sno CHAR (9), PRIMARY KEY (Sno), 
Sname CHAR (8) NOT NULL, 
Ssex CHAR (2) CHECK ( Ssex IN (' 男 ', ' 女 ') )， 
Sage SMALLINT, 
Sdept CHAR (20), 
CHECK (Ssex = ' 女 ' OR Sname NOT LIKE'Ms. %') 
); /* 定义 了 元 组 中 Sname 和 Ssex 两 个 属性 值 之 间 的 约束 条 件 * / 


解 题 说 明 : 

性 别 是 女性 的 元 组 都 能 通过 该 项 CHECK 检查 ,因为 Ssex= ' 女 ' 成 立 ; 当 性 别 是 男性 
时 ,要 通过 检查 则 名 字 一 定 不 能 以 Ms. 打头 ,因为 Ssex= ' 男 ' 时 ,条 件 要 想 为 真 值 ,Sname 
NOT LIKE'Ms. % ' 必 须 为 真 值 。 

2. 元 组 上 约束 条 件 的 检查 和 违约 处 理 

向 表 中 插入 元 组 或 修改 属性 值 的 时 候 , 系 统 会 对 属性 上 的 约束 条 件 和 元 组 上 的 约束 条 
件 进行 检查 ,如 不 满足 条 件 , 则 拒绝 执行 操作 。 


7.6 完整 性 约束 命名 子 名 


上 面 介绍 的 完整 性 约束 条 件 的 定义 都 是 在 创建 表 时 进行 的 。 在 实际 应 用 中 经 常会 遇 到 
在 数据 表 创 建 完 毕 后 对 原 表 增 加 新 的 约束 或 删除 表 中 的 某 些 约束 条 件 。 为 了 处 理 这 些 情 
况 ,SQL 还 在 CREATE TABLE 语句 中 提供 了 完整 性 约束 命名 子 句 CONSTRAINT ,用 来 
对 完整 性 约束 条 件 命名 ,从 而 更 加 灵活 方便 地 对 某 个 完整 性 约束 条 件 进 行 操作 。 

1. 完整 性 约束 命名 子 句 


CONSTRAINT < 完整 性 约束 条 件 名 >< 完 整 性 约束 条 件 > 


< 完整 性 约束 条 件 > 包 括 NOT NULL、UNIQUE、PRIMARY KEY、FOREIGN KEY、 
CHECK 短语 等 。 

【 例 9〗 建立 学 生 登 记 表 Student, 要 求学 号 为 10000 一 19999 ,姓名 不 能 取 空 值 ,学 生 的 
年 龄 为 10 一 30 岁 ,性别 只 能 是 “ 男 ” 或 “ 女 ”。 

CREATE TABLE Student 

(Sno NUMERIC (6), 


Sname CHAR (20), 
Sage NUMERIC (3), 


Ssex CHAR (2), 

CONSTRAINT C1 CHECK (Sno BETWEEN 10000 AND 19999), 
CONSTRAINT C2 NOT NULL, 

CONSTRAINT C3 (Sage> = 10 RND Sage< = 30 )， 
CONSTRAINT C4 CHECK (Ssex IN (' 男 ', ' 女 ')， 

CONSTRAINT StudentKey PRIMARY KEY (Sno)); 


解 题 说 明 : 

在 Student 表 上 建立 了 5 个 约束 条 件 , 包 括 主 码 约束 (命名 为 StudentKey) 以 及 Cl、C2、 
C3、C4 这 4 个 列 级 约束 。 

例 9 中 所 有 的 完整 性 约束 均 采 用 CONSTRAINT 短语 进行 定义 。 

2. 修改 表 中 的 完整 性 限制 

可 以 使 用 ALTER TABLE 语句 修改 表 中 的 完整 性 限制 。 

【 例 10】 例 9 中 去 掉 Student 表 中 对 性 别 的 限制 。 

ALTER TABLE Student 

DROP CONSTRAINT C4 

【 例 11】 修改 表 Student 中 的 约束 条 件 , 要 求学 号 改 为 100000 一 199999 ,年 龄 由 
10 一 30 改 为 10 一 40。 

可 以 先 删 除 原来 的 约束 条 件 , 再 增加 新 的 约束 条 件 。 

ALTER TABLE Student 

DROP CONSTRAINT C1; 

ALTER TABLE Student 

ADD CONSTRAINT C1 CHECK (Sno BETWEEN 100000 AND 199999); 

ALTER TABLE Student 

DROP CONSTRAINT C3; 


ALTER TABLE Student 
ADD CONSTRAINT C3 CHECK(Sage > = 10 AND Sage< = 40 ); 


7.7 断 盲 


若 完 整 性 约束 涉及 多 个 关系 或 与 聚合 操作 有 关 , 则 可 采用 SQL 的 断言 机 制 来 完成 。 断 
言 (Assertion) 是 完整 性 约束 的 一 个 特殊 类 型 。 一 个 断言 可 以 对 基本 表 的 单独 一 行 或 整个 
基本 表 定义 有 效 值 集合 .或 定义 存在 于 多 个 基本 表 中 的 有 效 值 集合 。 断 言 创建 以 后 ,任何 对 
断言 中 所 涉及 关系 的 操作 都 会 触发 关系 数据 库 管 理 系统 对 断言 的 检查 ,任何 使 断言 不 为 真 
值 的 操作 都 会 被 拒绝 执行 。 

1. 创建 断言 的 语句 格式 

断言 可 以 用 CREATE ASSERTION 语句 创建 ,其 形式 为 : 


CREATE ASSERTION < 断言 名 > CHECK(,< 条 件 表达 式 >) 


每 个 断言 都 被 赋予 了 一 个 名 字 ,< CHECK 子 句 > 中 的 约束 条 件 与 WHERE 子 句 的 条 件 


第 
要 
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【 例 12】 限制 每 门 课程 最 多 只 能 100 名 学 生 选 修 。 


CREATE ASSERTION Assert1 
CHECK(100 > = (SELECT count( Sno) /* 此 断言 的 谓词 涉及 聚集 操作 count 的 SQL 语句 * / 
FROM SC 
GROUP BY Cno) 
); 
解 题 说 明 : 
每 当 学 生 选 修 课 程 时 ,将 在 SC 表 中 插入 一 条 元 组 (Sno,Cno,NULL) ,Assert 断言 被 触 
发 检查 。 如 果 选 修 数 据 库 课程 的 人 数 已 经 超过 100 人 ,CHECK 子 句 返回 值 为 “ 假 ”, 对 SC 
表 的 操作 被 拒绝 。 
2. 删除 断言 的 语句 格式 
DROP ASSERTION < 断言 名 > 
【 例 13】 删除 上 述 Assertl 断言 。 


DROP ASSERTION Assertl; 


如 果断 言 很 复杂 , 则 系统 在 检测 和 维护 断言 上 的 开销 较 高 ,这 是 在 使 用 断言 时 应 该 注 


7.8 数据 库 触 发 器 


7.8.1 触发 器 机 制 


触发 器 (Trigger) 在 数据 库 系 统 中 起 着 特殊 的 作用 , 它 是 定义 在 关系 表 上 的 一 类 有 事件 
驱动 的 特殊 过 程 , 可 用 触发 器 完成 很 多 数据 库 完整 性 保护 的 功能 。 其 中 触发 事件 即 是 完整 
性 约束 条 件 ,而 完整 性 约束 检查 即 是 触发 条 件 的 检查 过 程 ,最 后 处 理 过 程 的 调用 即 是 完整 性 
检查 的 处 理 。 

从 根本 上 讲 触发 器 是 用 户 定义 在 关系 表 上 的 一 类 由 事件 驱动 的 特殊 过 程 。 其 特殊 性 表 
现在 一 旦 定义 ,无 须 用 户 调用 ,任何 对 表 的 更 新 操作 ( 即 增 、 删 \ 改 操作 ) 均 由 系统 自动 激活 触 
发 器 执行 定义 的 SQL 语句 ,在 RDBMS 核心 层 进行 集中 的 完整 性 控制 。 触 发 器 的 功能 类 似 
于 约 东 条 件 , 但 是 比 约 东 条 件 功 能 更 为 强大 ,也 更 加 灵活 ,能 够 实现 由 主 码 和 外 码 所 不 能 保 
证 的 、 更 为 复杂 的 检查 和 操作 ,具有 更 精细 和 更 强大 的 数据 控制 能 力 , 实 现 复杂 的 完整 性 
要 求 。 

一 般 而 言 ,在 完整 性 约束 功能 中 , 当 系 统 检查 数据 中 有 违反 完整 性 约束 条 件 时 ,仅仅 给 
用 户 必要 的 提示 信息 ; 而 触发 器 不 仅 给 出 提示 信息 ,还 会 引起 系统 内 部 自动 进行 某 些 操作 ， 
以 消除 违反 完整 性 约束 条 件 所 引起 的 负面 影响 。 另 外 ,和 触发 器 除了 具有 完整 性 保护 功能 外 ， 
还 具有 安全 性 保护 功能 。 

在 SQL Server 2008 中 ,触发 器 分 为 两 类 。 

(1) DML(Data Manipulatiom Language) 触 发 器 : 该 触发 器 是 当 数 据 库 服务 器 中 发 生 
数据 操作 语言 事件 时 执行 的 存储 过 程 。 


(2) DDL 触发 器 (Data Definition Language) 触 发 器 : 该 触发 器 是 在 响应 数据 定义 语言 
事件 时 执行 的 存储 过 程 ,一 般 用 于 执行 数据 库 中 的 管理 任务 、 审 核 和 规范 数据 库 操作 、 防 止 
数据 库 表 结构 被 修改 等 。 

人 们 使 用 触发 器 加 强 一 些 商 用 规则 ,以 维护 日 志 或 在 约 东 规则 太 严 格 之 处 代替 约 东 。 
目前 ,在 SQL 99 标准 中 引进 了 “触发 器 ”的 概念 ,但 是 很 多 关系 数据 库 管理 系统 很 早 就 支持 
触发 器 ,因此 不 同 的 关系 数据 库 管理 系统 实现 的 触发 器 语法 各 不 相同 、 互 不 兼容 。 请 读者 在 
定义 触发 器 时 注意 阅读 所 用 系统 的 使 用 说 明 。 


7.8.2 触发 器 的 三 要 素 


触发 器 有 时 候 也 称 作 事件 -条 件 -动作 规则 (Event-Condition-Action Rule, ECA 规则 )。 
一 个 触发 器 由 以 下 3 部 分 组 成 。 

(1) 事件 : 引起 触发 器 动作 的 事件 ,通常 是 更 新 操作 。 当 数据 库 程序 员 声 明 的 事件 发 
生 时 ,触发 器 开始 工作 。 

(2) 条 件 : 当 触 发 器 被 事件 激活 时 ,不 是 立即 执行 ,而 是 首先 测试 条 件 是 否 满足 。 如 果 
条 件 满足 ,就 执行 相应 操作 ,否则 什么 也 不 做 。 

(3) 动作 : 如 果 触 发 器 测试 满足 预订 的 条 
件 ,那么 与 该 触发 器 相关 联 的 动作 (Action) 由 数 
据 库 管 理 系统 执行 ( 即 对 数据 库 的 操作 )。 这 些 
动作 可 以 阻止 事件 发 生 ( 即 撤销 事件 ,如 删除 刚 
才 插 入 的 元 组 ) ,可 以 是 一 系列 对 于 数据 库 的 操 
作 , 甚 至 可 以 是 与 触发 事件 毫 无 关联 的 其 他 
操作 。 图 7-4 ”触发 器 模型 示意 图 

触发 器 的 事件 -条 件 -动作 模型 如 图 7-4 所 示 。 
7.8.3 SQL 触发 器 的 要 求 及 规则 


SQL 触发 器 是 一 个 SQL 数据 更 新 语句 引起 的 链 式 反应 ,触发 事件 大 多 局 限于 
UPDATE、DELETE 和 INSERT 等 操作 。 触 发 器 一 经 定义 便 存放 在 数据 字典 中 并 被 长 期 
保存 , 它 可 被 所 有 的 数据 库 操作 访问 。 它 规定 了 在 表 中 进行 更 新 之 前 或 之 后 执行 的 一 个 
SQL 语句 集合 。 

触发 体 只 能 包含 用 户 本 身 定义 的 SQL 程序 。 实 际 上 , 当 在 表 Table 上 创建 一 个 触发 器 
时 ,实际 上 是 每 当 发 生 改 变 表 的 事件 发 生 , 将 执行 下 一 步 的 SQL 语句 。 

例如 ,可 以 创建 一 个 触发 器 ,每 当 表 被 更 新 时 , 则 使 总 计 表 的 一 个 计数 器 增值 。 

SQL 和 触发 器 在 事件 ,条件 动作 三 要 素 中 为 用 户 提 供 了 多 种 选择 ,主要 有 以 下 5 种 。 

(1) 事件 包括 插入 数据 删除 数据 和 更 新 数据 ,更 新 事件 可 以 局 限 到 某 个 特定 的 属性 或 
某 些 属 性 。 

(2) 动作 可 以 在 触发 事件 之 前 或 之 后 执行 。 

(3) 在 被 触发 的 事件 中 ,动作 既 可 以 指向 被 插入 删除、 修改 元 组 的 新 值 ,也 可 以 指向 其 
旧 值 。 

(4) 条 件 由 WHEN 语句 声明 。 仅 仅 当 规则 被 触发 且 触 发 事件 的 发 生 使 条 件 成 立时 , 动 
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作 才 被 执行 。 

(5) 数据 库 程 序 员 可 以 选择 动作 执行 的 声明 方式 ,一 次 只 针对 一 个 更 新 元 组 或 一 次 针 
对 在 数据 库 操作 中 被 改变 的 所 有 元 组 。 

创建 一 个 触发 器 ,使 用 CREATE TRIGGER 语句 。 要 撤销 一 个 触发 器 ,使 用 DROP 
TRIGGER 语句 。 要 更 新 现存 一 个 触发 器 , 需 先 撤销 再 重新 定义 。 


7.8.4 定义 触发 人 器 


当 特 定 的 系统 事件 (如 对 一 个 表 的 增 、 删 、 改 操作 或 事务 的 结束 等 ) 发 生 时 ,对 规则 的 条 
件 进行 检查 ,如 果 条 件 成 立 则 执行 规则 中 的 动作 ,否则 不 执行 该 动作 。 规 则 中 的 动作 体 可 以 
很 复杂 ,可 以 涉及 其 他 表 和 其 他 数据 库 对 象 ,通常 是 一 段 SQL 存储 过 程 。 

SQL 使 用 CREATE TRIGGER 命令 建立 触发 器 ,其 一 般 格式 为 : 


CREATE TRIGGER < 触发 器 名 > /* 每 当 触 发 事件 发 生 时 ,该 触发 器 被 激活 * / 

{BEFORE| AFTER}< 触 发 事件 > ON< 表 名 > /* 指明 触发 器 激活 的 时 间 是 在 执行 触发 事件 前 或 后 * / 
REFERENCING NEW|OLD ROW AS < 变量 > / * REFERENCING 指出 引用 的 变量 * / 

FOR EACH { ROW | STATEMENT} /* 定义 触发 器 的 类 型 ,指明 动作 体 执行 的 频率 * / 
[WHEN < 触发 条 件 >]< 触 发 动作 体 > /* 仅 当 触 发 条 件 为 真 时 才 执 行 触发 动作 体 * / 


下 面 对 定 义 触发 器 的 各 部 分 语法 进行 详细 说 明 。 
(1) 如 果 CREATE TRIGGER 语句 作为 一 个 单独 的 SQL 语句 被 执行 ,当前 < 授权 ID > 
(是 标识 用 户 和 该 用 户 所 拥有 的 特权 集 的 字符 串 ) 必 须 是 这 个 新 触发 器 所 属 的 模式 的 拥有 
者 , 即 只 有 模式 的 拥有 者 才能 为 这 个 模式 创建 触发 器 , 且 一 个 表 上 定义 的 触发 器 数量 是 有 限 
的 。 触 发 器 的 具体 数量 由 具体 的 关系 数据 库 管理 系统 在 设计 时 确定 。 
(2) 触发 器 名 : 一 个 < 触发 器 名 > 是 一 个 < 标识 符 >, 可 以 包含 模式 名 ,也 可 以 不 包含 模式 
名 。 在 其 所 属 的 模式 里 是 唯一 的 , 且 触 发 器 名 称 和 表 名 必须 在 同一 模式 下 。 
。 如 果 在 一 个 CREATE SCHEMA 语句 中 没有 限定 < 触发 器 名 >, 则 默认 的 限定 符 是 
正 创 建 的 模式 名 。 

。 如 果 在 一 个 模块 中 的 其 他 SQL 语句 中 找到 了 未 限定 的 < 触发 器 名 >, 则 默认 的 限定 
符 是 在 定义 模块 的 MODULE 语句 中 的 SCHEMA 子 句 或 AUTHORIZATION 子 
句 标识 的 模式 名 。 

(3) 表 名 (目标 表 ): CREATE TRIGGER 语句 的 ON 子 句 命 名 了 触发 器 的 表 , 即 当 其 
中 数据 被 更 新 时 (被 插入 删除 或 修改 ) 引 起 触发 器 动作 的 基本 表 。 因 此 该 表 也 称 为 触发 器 
的 目标 表 。 另 外 ,触发 器 只 能 定义 在 基本 表 上 ,不 能 定义 在 视图 上 。 

(4) 触发 器 动作 时 间 : 定义 了 何 时 想 要 执行 触发 器 动作 。 如 果 您 要 触发 器 动作 在 触发 
事件 之 前 出 现 , 则 触发 器 动作 时 间 是 BEFORE ,如 果 想 要 在 之 后 出 现 , 则 和 触发 器 动作 时 间 是 
AFTER。 

BEFORE 在 触发 事件 进行 之 前 ,测试 WHEN 条 件 是 否 满足 , 若 满足 , 则 先 执行 动作 部 
分 的 操作 ,然后 再 执行 触发 事件 的 操作 (此 时 可 不 管 WHEN 条 件 是 否 满足 ) 。 

AFTER 在 触发 事件 完成 之 后 ,测试 WHEN 条 件 是 否 满足 , 若 满足 则 执行 动作 部 分 的 

INSTEAD OF 在 触发 事件 发 生 时 ,只 要 满足 WHEN 条 件 , 就 执行 动作 部 分 的 操作 ,而 


触发 事件 的 操作 不 再 执行 。 

(5) 触发 事件 : 触发 事件 定义 了 在 触发 器 表 上 的 SQL 数据 更 新 语句 , 它 的 执行 将 激活 
触发 器 ; 可 以 是 INSERT、DELETE 或 UPDATE 三 类 事件 ,也 可 以 是 这 几 个 事件 的 组 合 ， 
如 INSERT OR DELETE 等 ,只 有 在 UPDATE 情况 下 ,可 以 增加 一 个 可 选项 子 句 以 标 出 触 
发 列 , 即 为 UPDATE OF < 触发 属性 列表 ,…>( 只 有 在 UPDATE 时 允许 后 面 跟 OF < 触发 属 
性 列表 ,…>) , 即 进一步 指明 修改 哪些 属性 时 激活 触发 器 。 如 果 省 略 这 个 可 选项 子 句 ,其 作 
用 范围 是 命名 的 触发 器 表 的 每 一 个 属性 。DELETE 和 INSERT 都 是 对 整个 元 组 的 操作 ,不 
允许 后 面 跟 *OF < 属性 列表 >”。 

(6) REFERENCING 子 句 。CREATE TRRGGER 语句 的 REFERENCING 子 句 定义 
了 具有 1 一 4 个 特殊 值 的 变量 名 (或 别名 ) 的 清单 : 

。 触发 器 在 其 上 进行 操作 的 旧 行 的 变量 名 ; 

。 触发 器 在 其 上 进行 操作 的 新 行 的 变量 名 ; 

。 触发 器 在 其 上 进行 操作 的 旧 表 名 ; 

。 和 触发 器 在 其 上 进行 操作 的 新 表 名 。 

每 一 个 只 能 被 规定 一 次 。 如 果 既 没有 规定 ROW, 也 没有 规定 TABLE, 则 默认 为 
ROW。 如 果 和 触发 动作 包含 了 对 触发 器 的 < 表 名 > 或 其 任何 一 个 < 列 名 > 的 引用 , 则 触发 器 的 
定义 必须 包含 有 REFERENCING 子 句 。OLD 值 是 在 UPDATA/DELETE 触发 事件 之 前 
的 值 ,NEW 值 是 在 UPDATE/DELETE 触发 事件 之 后 的 值 。 如 果 触 发 动作 时 间 是 
BEFORE,REFERENCING 子 句 不 能 规定 OLD TABLE 或 NEW TABLE。 

每 个 触发 事件 都 具有 其 本 身 的 “执行 上 下 文 ”, 包 括 触 发 器 的 表 的 旧 行 值 和 /或 新 行 值 。 
如 果 触 发 事件 是 INSERT, 则 没有 旧 行 值 ,因为 没有 现存 的 行 受 INSERT 的 影响 。 如 果 触 
发 事件 是 DELETE, 则 没有 新 行 值 ,因为 DELETE 的 操作 是 从 表 中 删除 一 行 。 如 果 是 
UPDATE, 则 有 三 种 情况 : 

在 触发 器 的 表 中 数据 的 实际 行 ; 

实际 行 的 “ 旧 值 行 ” 拷 贝 ; 

实际 行 的 “新 行 值 ” 拷 贝 。 它 包含 了 DBMS 在 UPDATE 语句 执行 完 后 准备 将 实际 
行 改变 成 的 值 , 称 之 为 “新 行 ", 所 有 新 行 的 集合 称 为 “新 表 ” (注意 即 使 是 BEFORE 
触发 ,DBMS 也 知道 “新 行 值 ”) 。 

(7) 触发 器 类 型 。 触 发 器 按照 所 触发 动作 的 间隔 尺寸 可 以 分 为 元 组 级 触发 器 (FOR 
EACH ROW) 和 语句 级 触发 器 (FOR EACH STATEMENT) (默认 )。 前 者 对 于 每 一 个 修 
改 的 元 组 都 要 执行 一 次 ,而 后 者 对 SQL 语句 的 执行 结果 去 检查 。 

例如 ,假设 表 Student 有 10000 行 记 录 , 设 为 其 创建 了 AFTER UPDATE OF Sno ON 
Student 触发 器 ,如 果 动 作 间 隔 尺寸 为 语句 级 触发 器 ,那么 执行 完 UPDATE 语句 后 触发 动 
作 体 只 执行 一 次 ; 如 果 是 元 组 级 触发 器 ,触发 动作 体 将 执行 10000 次 (触发 表 一 行 一 次 )。 
虽然 默认 值 为 FOR EACH STATEMENT, 但 是 FOR EACH ROW 间隔 更 常见 。 实 际 上 ， 
和 触发 器 定义 包含 有 OLD ROW 或 NEW ROW 的 REFERENCING 子 句 ,必须 含有 一 个 动作 
间隔 尺寸 FOR EACH ROW。 
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(8) 触发 条 件 

和 触发 器 被 激活 时 ,只 有 当 触 发 条 件 为 真 时 触发 动作 体 才 执行 ,否则 触发 动作 体 不 执行 。 
触发 条 件 用 WHEN 语句 来 定义 , 它 可 以 是 任意 的 条 件 表 达 式 。 如 果 省 略 WHEN 触发 条 
件 , 则 触发 动作 体 在 触发 器 激活 后 立即 执行 。 

(9) 触发 动作 体 : 触发 动作 是 当 触发 器 被 激活 时 想 要 执行 的 语句 。 它 既 可 以 是 一 组 
SQL 语句 ,也 可 以 是 对 已 创建 存储 过 程 的 调用 。 如 果 是 元 组 级 触发 器 ,在 两 种 情况 下 ,用户 
都 可 以 在 过 程 体 中 使 用 NEW 和 OLD 引用 UPDATE/INSERT 事件 之 后 的 新 值 和 
UPDATE/INSERT 事件 之 前 的 旧 值 。 如 果 是 语句 级 触发 器 , 则 不 能 在 触发 动作 体 中 使 用 
NEW 和 OLD 进行 引用 。 

如 果 触 发 动作 体 执 行 失败 ,激活 触发 器 的 事件 ( 即 对 数据 库 的 增 、 删 、 改 操作 ) 就 会 终止 
执行 ,触发 器 的 目标 表 或 触发 器 可 能 影响 的 其 他 对 象 不 发 生 任何 变化 。 

【 例 14】 当 对 表 SC 的 Grade 属性 进行 修改 时 , 若 分 数 增加 了 30%, 则 将 此 次 操作 记 
录 到 另 一 个 表 SC_U(Sno .Cno Oldgrade、Newgrade) 中 ,其 中 Oldgrade 是 修改 前 分 数 ， 
Newgrade 是 修改 后 的 分 数 。 


CREATE TRIGGER T_ SC_G /x*T_ SC G 是 触发 器 的 名 字 * / 

AFTER UPDATE OF Grade ON SC /* UPDATE OF Grade ON SC 是 触发 事件 * / 
/* AFTER 是 触发 的 时 机 ,表示 当 对 SC 的 Grade 属性 修改 完 后 再 触发 下 面 的 规则 * / 

REFERENCING 


OLDROW AS OldTuple, 
NEWROW AS NewTuple 
FOR EACH ROW /* 行 级 触发 器 , 即 每 执行 一 次 Grade 的 更 新 ,下 面 的 规则 就 执行 一 次 * / 
WHEN( NewTuple. Grade> = 1. 3 x OldTuple. Grade) /* 触发 条 件 , 只 有 该 条 件 为 真 时 才 执行 * / 
INSERT INTO SC_U (Sno，Cno，01dGrade，NewGrade) /* 下 面 的 Insert 操作 * / 
VALUES(OldTuple. Sno, OldTuple. Cno, OldTuple. Grade, NewTuple. Grade) 


解 题 说 明 : 

在 本 例 中 REFERENCING 指出 引用 的 变量 ,如 果 触 发 事件 是 UPDATE 操作 并 且 有 
FOR EACH ROW 子 句 , 则 可 以 引用 的 变量 有 OLDROW 和 NEWROW, 分 别 表示 修改 之 
前 的 元 组 和 修改 之 后 的 元 组 。 若 没有 FOR EACH ROW 子 句 , 则 可 以 引用 的 变量 有 
OLDTABLE 和 NEWTABLE,OLDTABLE 表示 表 中 原来 的 内 容 ,NEWTABLE 表示 表 中 
变化 后 的 部 分 。 

【 例 15】 将 每 次 对 表 Student 的 插入 操作 所 增加 的 学 生 个 数 记 录 到 表 Student- 
InsertLog 中 。 


CREATE TRIGGER Student _Count 

AFTER INSERT ON Student /* 指明 触发 器 激活 的 时 间 是 在 执行 INSERT 后 */ 

REFERENCING 

NEW TABLE AS DELTA 

NEWROW RS NewTuple 

FOR EACH STATEMENT /x 语句 级 触发 器 , 即 执行 完 INSERT 语句 后 下 面 的 触发 动作 体 才 执行 一 次 * / 
INSERT INTO StudentlnsertLog (Numbers) 
SELECT COUNT ( * ) FROM DELTA 


解 题 说 明 : 


在 本 例 中 出 现 的 FOR EACH STATEMENT ,表示 触发 事件 INSERT 语句 执行 完成 后 
才 执行 一 次 触发 器 中 的 动作 ,这 种 触发 器 叫 作 语句 级 触发 器 。 例 14 中 的 触发 器 是 元 组 级 触 
器 。 默 认 的 触发 器 是 语句 级 触发 器 。DELTA 是 一 个 关系 名 ,其 模式 与 Student 相同 ,包含 
的 元 组 是 INSERT 语句 增加 的 元 组 。 


7.8.5 激活 触发 器 


触发 器 的 执行 是 由 触发 事件 激活 ,并 由 数据 库 服 务 器 自动 执行 的 。 一 个 数据 表 上 可 能 
定义 了 多 个 触发 器 ,如 多 个 BEFORE 触发 器 、 多 个 AFTER 触发 器 等 ,同一 个 表 上 的 多 个 触 
发 器 激活 时 遵循 如 下 的 执行 顺序 。 

(1) 执行 该 表 上 的 BEFORE 触发 器 。 

(2) 激活 触发 器 的 SQL 语句 。 

(3) 执行 该 表 上 的 AFTER 触发 器 。 

对 于 同一 个 表 上 的 多 个 BEFORE(AFTER) 和 触发 器 ,遵循 “ 谁 先 创 建 谁 先 执行 的 原则 ， 
即 按照 触发 器 创建 的 时 间 先 后 顺序 执行 。 但 是 不 同 的 DBMS 有 不 同 的 规定 ,例如 有 些 关系 
数据 库 管理 系统 是 按照 触发 器 名 称 的 字母 排序 顺序 执行 触发 器 。 


7.8.6 触发 器 的 修改 与 删除 
1. 修改 触发 器 的 语句 格式 为 : 


ALTER TRIGGER < 触发 器 名 > 

{BEFORE| AFTER}< 触 发 事件 > ON < 表 名 > 

REFERENCING NEW|OLD ROW AS < 变量 > 

FOR EACH { ROW |STATEMENT} 

[WHEN < 触发 条 件 >] < 触发 动作 体 > 

除了 使 用 关键 字 ALTER 替换 关键 字 CREATE, 修 改 触发 器 的 语句 与 创建 触发 器 的 语 
句 基 本 相同 。 

2. 删除 触发 器 的 SQL 语法 如 下 : 

DROP TRIGGER < 触发 器 名 > ON < 表 名 > ; 

【 例 16】 将 例 15 中 创建 的 触发 器 删除 


DROP TRIGGER Student _Count ON Student; 


触发 器 只 能 由 具有 相应 权限 的 用 户 删除 一 个 已 经 创建 的 触发 器 。 
触发 器 是 一 种 功能 强大 的 工具 ,但 在 使 用 时 要 慎重 ,因为 在 每 次 访问 一 个 表 时 都 可 能 触 
发 一 个 触发 器 ,这 样 会 影响 系统 的 性 能 。 


7.9 小 结 
本 章 对 数据 库 完 整 性 进行 了 详细 的 讲解 。 数 据 库 的 完整 性 是 为 了 保证 数据 库 中 存储 的 


数据 是 正确 的 \ 相 容 的 , 即 要 符合 现实 世界 语义 。 本 章 介绍 了 关系 数据 库 管 理 系统 完整 性 实 
现 的 机 制 ,包括 完整 性 约束 定义 机 制 、 检 查 机 制 和 违背 完整 性 约束 条 件 时 关系 数据 库 管理 系 | 章 


BE 
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统 应 采取 的 动作 等 。 

在 关系 系统 中 ,最 主流 的 完整 性 约束 分 类 方法 是 将 完整 性 约束 分 为 实体 完整 性 .参照 完 
整 性 和 用 户 定义 完整 性 三 大 类 。 最 重要 的 完整 性 约束 是 实体 完整 性 和 参照 完整 性 ,其 他 完 
整 性 约 东 条 件 则 可 以 归 入 用 户 定义 的 完整 性 。 

数据 库 完 整 性 的 定义 一 般 由 SQL 的 数据 定义 语言 来 实现 。 它 们 作为 数据 库 模式 的 一 
部 分 存 人 数据 字典 中 ,在 数据 库 数据 修改 时 关系 数据 库 管理 系统 的 完整 性 检查 机 制 将 按照 
数据 字典 中 定义 的 这 些 约束 进行 检查 。 目 前 的 关系 数据 库 管理 系统 都 提供 了 定义 和 检查 实 
体 完 整 性 、 参 照 完 整 性 和 用 户 定义 的 完整 性 的 功能 。 

对 于 违反 完整 性 的 操作 一 般 的 处 理 是 采用 默认 方式 ,如 拒绝 执行 。 对 于 违反 参照 完整 
性 的 操作 ,本 书 讲解 了 不 同 的 处 理 策略 。 用 户 要 根据 应 用 语义 来 定义 合适 的 处 理 策略 ,以 保 
证 数据 库 的 正确 性 。 

最 后 介绍 了 触发 器 ,触发 器 比 约束 条 件 功能 更 为 强大 和 灵活 ,能 够 实现 由 主 码 和 外 码 所 
不 能 保证 的 、 更 为 复杂 的 完整 性 要 求 。 

不 过 要 特别 注意 的 是 ,一 个 触发 器 的 动作 可 能 激活 另 一 个 触发 器 ,最 坏 的 情况 是 导致 一 
个 触发 链 , 从 而 造成 难以 预见 的 错误 。 


习 题 


. 什么 是 数据 库 的 完整 性 ? 
. 试 论述 数据 库 完整 性 的 基本 概念 与 数据 库 安全 性 概念 的 关系 。 
. 试 分 别论 述 关 系数 据 库 3 类 完整 性 的 概念 ,并 举例 说 明 。 
. 关系 数据 库 管理 系统 在 实现 参照 完整 性 时 需要 考虑 哪些 方面 ? 
. 试 述 DBMS 的 完整 性 约束 机 制 应 具有 哪些 功能 ? 
. 假设 有 下 面 两 个 关系 模式 : 
职工 (职工 号 ,姓名 ,年 龄 , 职务, 工资, 部门 号 ), 其 中 职工 号 为 主 码 ; 
部 门 (部 门 号 ,名 称 ,经 理 名 ,电话 ), 其 中 部 门 号 为 主 码 。 
用 SQL 语言 定义 这 两 个 关系 模式 ,要求 在 模式 中 完成 以 下 完整 性 约束 条 件 的 定义 : 
(1) 定 义 每 个 模式 的 主 码 ; (2) 定 义 参 照 完 整 性 ; (3) 定 义 职工 年 龄 不 得 超过 60 岁 。 
7. 在 关系 系统 中 , 当 操作 违反 实体 完整 性 参照 完整 性 和 用 户 定义 的 完整 性 约束 条 件 
时 ,一 般 是 如 何 分 别 进行 处 理 的 ? 


Do mo 
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【本 章 主要 内 容 】 

1. 重点 阐述 事务 的 概念 及 四 个 特性 。 

2. 简单 介绍 数据 库 故障 的 分 类 及 恢复 的 实现 技术 。 
3. 详细 介绍 数据 库 的 恢复 策略 。 

4. 简 述 检查 点 恢复 技术 和 数据 库 镜像 的 概念 。 


本 章 及 下 一 章 将 讨论 事务 处 理 (Transaction Processing) 的 相关 技术 。 事 务 处 理 技术 主 
要 包括 数据 库 恢 复 技术 和 并 发 控制 技术 。 数 据 库 恢复 机 制 和 并 发 控制 机 制 是 数据 库 管 理 系 
统 的 重要 组 成 部 分 。 

之 所 以 DBMS 要 采用 数据 库 恢复 技术 ,是 由 于 DBMS 中 并 不 是 每 一 个 对 数据 库 的 完整 操 
作 都 可 以 用 一 条 命令 来 完成 的 ,多 数 情 况 下 都 可 能 需要 一 组 命令 来 完成 一 个 完整 的 操作 。 但 
是 ,由 于 计算 机 系统 及 其 外 部 环境 的 不 可 抗拒 因素 造成 的 故障 ,将 可 能 导致 数据 库 系 统 遭 到 破 
坏 。 常 见 故 障 产生 的 原因 包括 电源 掉 电 、 软 件 错误 和 人 为 失误 等 。 当 这 些 错误 或 意外 发 生 时 ， 
会 使 正在 进行 的 操作 强制 中 断 , 这 时 候 对 数据 的 更 新 可 能 尚未 完成 ,数据 既 不 是 当前 的 正确 状 
态 , 也 不 是 在 此 之 前 某 一 时 刻 的 正确 状态 ,数据 处 于 “未 知 ” 状 态 ,“ 未 知 " 状 态 的 数据 是 不 可 靠 
的 ,也 是 不 能 使 用 的 。 因 此 ,数据 库 管理 系统 应 具有 恢复 机 制 ,保证 数据 库 在 破坏 之 后 ,能够 将 
数据 的 错误 状态 恢复 到 某 个 已 知 的 正确 状态 ,保持 数据 在 某 一 时 刻 的 正确 性 ,将 各 类 故障 给 数 
据 库 带 来 的 损失 降 到 最 低 。 为 此 ,DBMS 中 引入 了 数据 库 恢 复 技术 以 解决 上 述 问题 。 

另外 由 于 数据 库 是 一 种 共享 资源 ,因此 可 能 存在 多 个 用 户 同时 使 用 数据 库 资源 的 情况 。 
DBMS 允许 多 个 事务 并 发 执行 ,但 是 , 当 多 个 事务 并 发 执行 时 ,即使 每 个 事务 都 正确 执行 ， 
数据 库 的 一 致 性 也 可 能 遭 到 破坏 。 为 了 防止 并 发 执行 产生 的 问题 ,DBMS 还 需要 具备 并 发 
控制 能 力 。 

恢复 和 并 发 控制 是 保证 事务 正确 执行 的 两 项 基本 措施 ,它们 合 称 为 事务 管理 。 

通过 本 章 的 学 习 , 读 者 应 该 掌握 .了 解 事务 的 基本 概念 、 特 性 以 及 数据 库 恢 复 技术 的 方 
法 与 技术 ; 下 一 章 将 着 重 介 绍 并 发 控制 的 相关 理论 。 这 样 才能 对 数据 库 的 事务 管理 有 一 个 
基本 认识 。 


8.1 事务 的 基本 概念 


在 讨论 数据 库 恢复 技术 及 并 发 控制 之 前 ,首先 了 解 事务 的 基本 概念 及 其 特性 。 
8.1.1 事务 的 概念 
所 谓 事务 (Transaction) 是 数据 库 环境 中 的 一 个 不 可 分 割 的 逻辑 工作 单元 。 它 是 用 户 
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定义 的 一 个 数据 库 操作 序列 ,这 些 操作 要 么 全 做 ,要 么 全 不 做 ( 即 不 对 数据 库 留 下 任何 影 
响 ) ,是 一 个 不 可 分 割 的 工作 单位 。 例 如 ,在 关系 数据 库 中 ,一 个 事务 可 以 是 一 条 SQL 语句 、 
一 组 SQL 语句 或 整个 程序 。 

事务 和 程序 是 两 个 概念 。 一 般 地 讲 , 一 个 程序 中 包含 多 个 事务 。 

一 般 事务 的 开始 与 结束 可 以 由 用 户 显 式 控制 。 如 果 用 户 没 有 显 式 地 定义 事务 , 则 由 
DBMS 按 默认 规定 自动 划分 事物 。 在 SQL 中 ,定义 事务 的 语句 一 般 有 三 条 : 


BEGIN TRANSRCTION 


COMMIT 

ROLLBACK 

事务 通常 是 以 BEGIN TRANSACTION 开始 ,以 COMMIT 或 ROLLBACK 结束 。 
其 中 ， 


(1) BEGIN TRANSACTION: 事务 开始 语句 。 此 语句 表示 事务 从 此 句 开 始 执行 ,此 语 
名 也 是 事务 回 滚 的 标志 点 ,对 数据 库 的 每 个 操作 都 包含 着 一 个 事务 的 开始 。 但 在 大 多 数 情 
况 下 ,可 省 略 此 语句 。 

(2) COMMIT: 事务 提交 语句 。 即 提交 事务 的 所 有 操作 。 上 有 具体 地 说 就 是 将 事务 中 所 有 
对 数据 库 的 更 新 写 回 到 磁盘 上 的 物理 数据 库 中 去 ,事务 正常 结束 。 如 果 省 略 * 事 务 开始 ” 语 
句 , 则 同时 表示 开始 一 个 新 的 事务 。 

(3) ROLLBACK: 事务 回 滚 语句 。 即 在 事务 运行 的 过 程 中 发 生 了 某 种 故障 ,事务 不 能 
继续 执行 ,系统 将 事务 中 对 数据 库 的 所 有 已 完成 的 操作 全 部 撤销 , 回 滚 到 事务 开始 时 的 状 
态 。 这 里 的 操作 指 对 数据 库 的 更 新 操作 。 

有 时 对 事务 还 可 以 作 分 类 ,它们 是 按 事务 的 读 / 写 类 型 分 类 。 一 般 事务 是 由 * 读 ”与 “ 写 ” 
语句 组 成 ,而 当 事 务 仅 由 * 读 ”语句 组 成 时 则 此 事务 的 最 终 提交 变 得 十 分 简单 。 因 此 ,有 时 可 
以 将 事务 分 成 “ 读 写 ” 型 与 “只 读 ” 型 两 种 ,以 方便 事务 的 不 同 处 理 。 


8.1.2 事务 的 状态 与 将 性 


1. 事务 的 状态 

一 个 事务 从 开始 到 成 功 地 完成 或 者 因 故 中 止 , 可 分 为 三 个 阶段 : 即 事务 初 态 一 事物 执 
行 一 事务 完成 ,事务 的 三 个 阶段 如 图 8-1(a) 所 示 。 

一 个 事务 从 开始 到 结束 ,中 间 可 经 历 以 下 不 同 的 状态 。 

。 活动 状态 (Active) 。 

。 局 部 提交 状态 (Partially Committed) 。 

。 失败 状态 (Failed) 。 

。 中 止 状态 (Aborted) 。 

。 提交 状态 (Committed) 。 

事务 定义 语句 与 状态 的 关系 如 图 8-1(b) 所 示 。 

2. 事务 的 特性 

事务 具有 以 下 4 个 特性 : 原子 性 (Atomicity) 一致 性 (Consistency)、 隔 离 性 (Tsolation) 
和 持续 性 (Durability)。 这 4 个 特性 简称 为 ACID 特性 。 


-一 -二 | 事务 开始 语句 上 -一 -一 事务 执行 


非 正常 结束 下 党 结 来 


事务 提交 语句 


事务 回 滚 语句 


(a) 事务 的 三 个 阶段 


/ 
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ROLLBACK 


续 正 常 执行 事务 回 深 ， 数 据 库 
恢复 到 事务 初 态 
(b) 事务 定义 语句 与 状态 的 关系 


图 8-1 事务 的 执行 及 状态 


(1) 执行 的 原子 性 

从 终端 用 户 的 角度 看 ,事务 是 数据 库 的 不 可 再 分 的 逻辑 工作 单位 。 

从 系统 的 角度 看 ,事务 在 执行 时 ,应 遵守 "要么 不 做 ,要 么 全 做 "的 原则 , 即 不 允许 事务 部 
分 地 完成 ,即使 因为 故障 而 使 事务 未 能 完成 ,在 恢复 时 也 要 消除 其 对 数据 库 的 影响 。 

保证 原子 性 是 数据 库 系统 本 身 的 职责 ,由 DBMS 的 事务 管理 子 系统 实现 。 

(2) 功能 上 的 保持 一 致 性 

事务 执行 的 结果 必须 是 使 数据 库 从 一 个 一 致 性 状态 变 到 另 一 个 一 致 性 状态 。 因 此 当 数 
据 库 只 包含 成 功 事 务 提交 的 结果 时 ,就 说 数据 库 处 于 一 致 性 状态 。 如 果 数据 库 系 统 运行 中 
发 生 故 障 , 有 些 事务 尚未 完成 就 被 迫 中 断 ,这 些 未 完成 的 事务 对 数据 库 所 做 的 修改 有 一 部 分 
已 写 入 物理 数据 库 , 这 时 数据 库 就 处 于 一 种 不 正确 的 状态 ,或 者 说 是 不 一 致 的 状态 。 例 如 一 
个 账户 的 收 支 之 差 应 等 于 其 余额 。 如 果 对 这 个 账户 只 拨款 ,不 修改 余额 , 则 数据 库 就 不 一 
致 ,这 样 的 数据 库 操作 序列 就 不 能 成 为 事务 。 只 有 既 拨款 又 修改 余额 ,才能 构成 一 个 完整 的 
事务 。 因 此 ,系统 一 旦 查 出 数据 库 的 完整 性 受到 破坏 , 则 撤销 该 事务 并 清除 该 事务 对 数据 库 
的 任何 影响 。 

可 见 一 致 性 与 原子 性 是 密切 相关 的 。 。 

功能 上 的 保持 一 致 性 可 由 编写 事务 程序 的 应 用 程序 员 完成 ,也 可 由 系统 测试 完整 性 约 | 章 
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束 自动 完成 。 

(3) 彼此 的 隔离 性 

如 果 多 个 事务 并 发 地 执行 ,应 像 各 个 事务 独立 执行 一 样 ,不 能 被 其 他 事务 干扰 , 即 一 个 
事务 的 内 部 操作 及 使 用 的 数据 对 其 他 并 发 事务 是 隔离 的 .不 可 见 的 。 并 发 控制 就 是 为 了 保 
证 事务 间 的 隔离 。 

隔离 性 由 DBMS 的 并 发 控制 子 系统 实现 。 

(4) 作用 的 持续 性 

持续 性 也 称 永久 性 (Permanence) 。 一 个 成 功 执行 的 事务 一 旦 提交 ,其 工作 的 结果 就 会 
永远 保存 在 数据 库 中 , 它 对 数据 库 中 数据 的 改变 就 应 该 是 永久 性 的 ,即使 数据 库 因 故 障 而 受 
到 破坏 ,DBMS 也 能 保持 或 恢复 。 

事务 的 持续 性 由 DBMS 的 子 系 统 实现 。 

保证 事务 ACID 特性 是 事务 管理 的 重要 任务 。ACID 特性 可 能 遭 到 破坏 的 因素 有 

。 事务 在 运行 过 程 中 被 强行 停止 ; 

。 多 个 事务 并 发 运行 时 ,不 同事 务 的 操作 交叉 执行 。 

在 第 一 种 情况 下 ,数据 库 管理 系统 必须 保证 被 强行 终止 的 事务 对 数据 库 和 其 他 事务 没 
有 任何 影响 。 在 第 二 种 情况 下 ,数据 库 管理 系统 必须 保证 多 个 事务 的 交叉 运行 不 影响 这 些 
事务 的 原子 性 。 

在 系统 故障 时 保障 事务 ACID 特征 的 技术 为 数据 库 恢 复 技术 ; 保障 事务 在 并 发 执行 时 
ACID 特征 的 技术 被 称 为 并 发 控制 。 恢 复 技术 和 并 发 控制 是 保证 事务 正确 执行 的 两 项 基本 
措施 ,它们 合 称 为 事务 管理 (Transaction Management)。 

这 些 就 是 数据 库 管 理 系统 中 恢复 机 制 和 并 发 控制 机 制 的 责任 。 

事务 是 恢复 和 并 发 控制 的 基本 单位 ,所 以 以 下 的 讨论 均 以 事务 为 对 象 。 


8.2 数据 库 恢 复 概述 


尽管 数据 库 系统 中 采取 了 各 种 保护 措施 来 防止 数据 库 的 安全 性 和 完整 性 被 破坏 ,保证 
并 发 事务 的 正确 执行 ,但 是 计算 机 系统 与 任何 其 他 系统 一 样 , 故 障 是 不 可 避免 的 。 发 生 故 障 
的 原因 多 种 多 样 , 例 如 计算 机 系统 中 磁盘 硬件 故障 、 软 件 错误 、 操 作 员 的 输入 错误 以 及 别 有 
用 心 的 人 的 恶意 破坏 等 。 一 旦 这 些 故 障 发 生 , 就 会 给 系统 造成 影响 , 轻 则 造成 正在 运行 事务 
的 非 正 常 中 断 ,影响 数据 库 中 数据 的 正确 性 , 重 则 破坏 数据 库 ( 如 磁盘 损坏 等 介质 故障 ) ,使 
数据 库 中 全 部 或 部 分 数据 丢失 。 因 此 .DBMS 必须 预先 采取 措施 ,使 数据 库 具 有 从 错误 状 
态 恢复 到 某 一 已 知 的 正确 状态 的 功能 ,保证 事务 的 ACID 特性 ,这 就 是 数据 库 的 恢复 。 只 有 
当 数 据 库 恢复 至 一 致 状态 , 才 允 许 用 户 访问 数据 库 。 本 节 主 要 讨论 事务 执行 过 程 中 发 生 故 
障 后 恢复 数据 库 为 一 致 状态 的 技术 , 即 数据 库 的 事务 恢复 技术 。 

恢复 子 系统 是 数据 库 管理 系统 的 一 个 重要 组 成 部 分 ,而 且 还 相当 庞大 ,常常 占 整 个 系统 
代码 的 10% 以 上 。 数 据 库 系 统 所 采用 的 恢复 技术 是 否 行 之 有 效 ,不仅 对 系统 的 可 靠 程度 起 
着 决定 性 作用 ,而 且 对 系统 的 运行 效率 也 有 很 大 影响 ,是 衡量 系统 性 能 优 劣 的 重要 指标 。 

数据 库 恢 复 机制 包 括 一 个 数据 库 恢复 子 系统 和 一 套 特 定 的 数据 结构 。 实 现 可 恢复 性 的 
基本 原理 是 重复 存储 数据 , 即 “ 数 据 宛 余 ”(Date Redundancy) 。 


恢复 机 制 涉及 的 两 个 关键 问题 是 : 

。 如 何 建立 元 余数 据 ; 

。 如 何 利用 这 些 宛 余数 据 实施 数据 库 恢 复 。 

数据 库 恢 复 的 基本 方法 有 定期 备份 数据 库 、 建 立 日 志文 件 , 即 建立 宛 余数 据 。 它 们 是 数 
据 库 恢复 的 基本 技术 ,通常 在 一 个 数据 库 系 统 中 ,这 两 种 方法 是 一 起 使 用 的 。 以 下 分 别 介绍 
故障 的 种 类 、 故 障 的 恢复 策略 以 及 这 些 故 障 恢 复 的 实现 技术 。 


8.3 故障 的 种 类 


数据 库 系 统 中 可 能 发 生 各 种 各 样 的 故障 ,大 致 可 以 分 以 下 几 类 : 事务 内 部 的 故障 、 系 统 
故障 、 介 质 故 障 、. 计 算 机 病毒 。 

1. 事务 内 部 的 故障 

事务 是 对 数据 库 的 操作 集合 ,事务 故障 是 指 事务 在 运行 至 正常 结束 点 前 被 中 止 。 事 务 
故障 又 分 为 可 预期 故障 和 非 预期 故障 。 可 预期 故障 可 由 应 用 程序 发 现 并 让 事务 滚 回 ,撤销 
已 作 的 修改 ,恢复 数据 库 到 正确 状态 ; 而 非 预期 故障 是 指 不 能 由 事务 程序 处 理 的 故障 ,这 时 
事务 因 无 法 执行 而 被 迫 停止 。 

事务 内 部 较 多 的 故障 是 非 预 期 的 ,是 不 能 由 应 用 程序 处 理 的 。 例 如 ,数据 库 中 没有 要 访 
问 的 数据 、 输 入 数据 类 型 不 对 、 除 数 为 零 、 并 发 事务 发 生死 锁 而 被 选中 撤销 该 事务 、 违 反 了 某 
项 完整 性 限制 而 被 终止 、 超 时、 申请 资源 过 多 、 人 工 操作 干预 等 。 

本 书后 续 内 容 中 ,事务 故障 仅 指 这 类 非 预期 的 故障 。 

下 面 举例 说 明 预 期 故障 情况 。 

例如 ,银行 转账 事务 ,这 个 事务 把 一 笔 金 额 从 一 个 账户 甲 转 给 另 一 个 账户 乙 。 

BEGIN TRANSACTION 

读 账 户 甲 的 余额 BALANCE; 

BALANCE = BALANCE — AMOUNT; / x AMOUNT 为 转账 金额 * / 

IF (BALANCE < 0) THEN 

{打印 "金额 不 足 , 不 能 转账 "; /* 事 务 内 部 可 能 造成 事务 被 回 滚 的 情况 * / 


ROLLBACK; } /* 撤销 刚才 的 修改 ,恢复 事务 * / 
ELSE 


{ 读 账户 乙 的 余额 BALANCE1; 

BALANCE1 = BALANCE 1 + AMOUNT; 

写 回 BALANCE1; 

COMMIT; } 

这 个 例子 所 包括 的 两 个 更 新 操作 要 么 全 部 完成 ,要 么 全 部 不 做 ,否则 就 会 使 数据 库 处 于 
不 一 致 状态 ,例如 可 能 出 现 只 把 账户 甲 的 余额 减少 而 没有 把 账户 乙 的 余额 增加 的 情况 。 

在 这 段 程序 中 若 产生 账户 甲 余额 不 足 的 情况 ,应 用 程序 可 以 发 现 并 让 事务 滚 回 ,撤销 已 
作 的 修改 ,恢复 数据 库 到 正确 状态 。 这 就 是 可 预知 的 故障 。 

这 类 故障 只 发 生 在 事务 上 ,而 整个 数据 库 系统 仍 在 控制 下 运行 。 事 务 故障 意味 着 事务 
没有 达到 预期 的 终点 (COMMIT 或 者 显 式 的 ROLLBACK) ,因此 ,数据 库 可 能 处 于 不 正确 
状态 。 恢 复 程 序 要 在 不 影响 其 他 事务 运行 的 情况 下 ,强行 回 滚 (ROLLBACK) 该 事务 , 即 撤 
销 该 事务 已 经 作出 的 任何 对 数据 库 的 修改 ,使 得 该 事务 好 像 根 本 没有 启动 一 样 。 
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这 类 恢复 操作 称 为 事务 撤销 (Undo)。 事 务 回 滚 ROLLBACK 就 是 由 一 组 Undo 操作 
所 组 成 。 

2. 系统 故障 

系统 故障 也 称 为 软 故障 (Soft Crash) ,是 指 造成 系统 停止 运转 的 任何 事件 ,使 得 系统 要 
重新 启动 。 例 如 ,特定 类 型 的 硬件 错误 (CPU 故障 ) ,操作 系统 故障 数据 库 管理 系统 的 代码 
错误 , 死 循 环 时 系统 安排 停止 .系统 骨 溃 、 突 然 停电 等 。 这 类 故障 影响 正在 运行 的 所 有 事务 ， 
但 不 破坏 数据 库 。 但 是 以 下 两 种 情况 都 会 使 数据 库 处 于 不 一 致 状态 。 

(1) 发 生 故 障 时 , 主 存 内 容 , 特 别 是 数据 库 缓冲 区 中 的 内 容 都 被 丢失 ,所 有 运行 事务 都 
非 正常 终止 。 这 时 可 能 一 些 尚未 完成 的 事务 的 结果 可 能 已 送 入 物理 数据 库 , 从 而 造成 数据 
库 可 能 处 于 不 正确 (不 一 致 ) 的 状态 。 为 保证 数据 一 致 性 ,需要 清除 这 些 事务 对 数据 库 的 所 
有 修改 。 

因此 故障 恢复 子 系统 必须 在 系统 重新 启动 时 让 所 有 非 正 常 终止 的 事务 回 滚 ,对 未 提交 
的 事务 进行 Undo( 撤 销 ) 操 作 。 

(2) 发 生 系统 故障 时 ,有 些 已 完成 的 事务 可 能 有 一 部 分 甚至 全 部 留 在 缓冲 区 ,尚未 写 回 
到 磁盘 上 的 物理 数据 库 中 ,系统 故障 使 得 这 些 事务 对 数据 库 的 修改 部 分 或 全 部 丢失 ,从 而 造 
成 数据 库 可 能 处 于 不 正确 (不 一 致 ) 的 状态 ,因此 应 将 这 些 事务 已 提交 的 结果 重新 写 和 人数 
据 库 。 

所 以 系统 重新 启动 后 ,恢复 子 系统 除 需 要 Undo( 撤 销 ) 所 有 未 完成 的 事务 外 ,还 需要 对 
已 提交 的 事务 进行 Redo( 重 做 ) 操 作 , 以 将 数据 库 真正 恢复 到 一 致 状态 。 

3. 介质 故障 

通常 系统 故障 称 为 软 故 障 , 而 介质 故障 称 为 硬 故障 (Hard Crash) 。 硬 故障 指 外 存 故 障 ， 
例如 划 盘 、 磁 头 碰撞 、 瞬 时 强 磁场 干扰 等 。 使 得 数据 库 受 损 ,影响 正在 存 取 这 部 分 数据 的 所 
有 事务 。 这 类 故障 将 破坏 存储 在 介质 上 的 数据 库 或 部 分 数据 库 , 并 影响 正在 存 取 这 部 分 数 
据 的 所 有 事务 。 

在 正常 情况 下 ,介质 故障 应 该 比 前 两 类 故障 发 生 的 可 能 性 小 得 多 ,但 是 一 旦 发 生 , 从 介 
质 故障 中 恢复 数据 库 是 很 费时 的 ,也 是 破坏 性 最 大 的 。 而 且 要 求 日 志文 件 提供 最 近 后 备 副 
本 后 ,提交 的 所 有 事务 的 后 像 , 数 据 量 也 是 很 大 的 。 

4. 计算 机 病毒 

除了 上 述 主要 的 故障 类 型 之 外 ,计算 机 病毒 也 是 一 种 故障 , 它 是 一 种 人 为 的 故障 或 破 
坏 。 特 点 是 它 可 以 像 微 生物 学 所 称 的 病毒 一 样 繁殖 和 传播 。 因 此 它 不 仅 具 有 破坏 性 ,还 是 
可 以 自我 复制 的 计算 机 程序 ,计算 机 病毒 会 对 计算 机 系统 包括 数据 库 造成 极 大 的 危害 。 计 
算 机 病毒 可 以 侵入 数据 库 , 对 数据 进行 自 改 ,还 可 以 通过 破坏 计算 机 系统 导致 系统 故障 ,其 
至 可 以 破坏 存储 介质 产生 介质 故障 。 

计算 机 病毒 已 成 为 计算 机 系统 的 主要 威胁 ,自然 也 是 数据 库 系统 的 主要 威胁 。 为 此 计 
算 机 的 安全 工作 者 已 研制 出 许多 预防 、 检 查 诊断、 消灭 计算 机 病毒 的 软件 。 但 是 ,至 今 还 没 
有 一 种 可 以 使 计算 机 “终生 ”免疫 的 “疫苗 ”"。 因 此 数据 库 一 旦 被 破坏 ,要 用 恢复 技术 对 数据 
库 加 以 恢复 ,一 般 按 介质 故障 处 理 。 

总 结 上 述 各 类 故障 对 数据 库 的 影响 ,有 两 种 可 能 性 : 一 是 破坏 数据 库 本 身 ; 二 是 数据 
库 没有 被 破坏 ,但 数据 可 能 不 正确 ,这 是 由 于 事务 的 运行 被 非 正常 终止 。 


恢复 的 基本 原理 十 分 简单 ,可 以 用 一 个 词 来 概括 一 一 元 余 。 这 就 是 说 ,数据 库 中 任何 部 
分 被 破坏 或 不 正确 的 数据 可 以 根据 存储 在 系统 别处 的 元 余数 据 来 重建 。 尽 管 恢复 的 基本 原 
理 很 简单 ,但 实现 技术 的 细节 却 相当 复杂 ,下 面 略 去 一 些 细节 ,介绍 数据 库 恢 复 的 实现 技术 。 


8.4 ”数据 库 恢复 的 实现 技术 


数据 对 一 个 数据 库 系 统 是 至 关 重 要 的 。 但 系统 发 生 故 障 时 ,可 能 会 导致 数据 的 丢失 ,其 
至 导致 一 个 数据 库 系统 的 瘫痪 ,因此 ,DBMS 必须 采用 一 定 的 恢复 技术 恢复 数据 库 中 丢失 
的 数据 。 

恢复 机 制 涉及 两 个 关键 问题 : 四 如 何 建立 完 余 数据 ; @@ 如 何 利用 这 些 宛 余数 据 实施 数 
据 库 恢复 。 

建立 元 余数 据 最 常用 的 技术 是 数据 转 储 和 登记 日 志文 件 (Log File)。 通 常 在 一 个 数据 
库 系 统 中 ,这 两 种 方法 是 一 起 使 用 的 。 


8.4.1 数据 转 储 


1. 数据 转 储 的 概念 

数据 转 储 是 数据 库 恢复 中 采用 的 基本 技术 。 所 谓 转 储 就 是 DBA 周期 性 地 将 整个 数据 
库 复制 到 磁带 、 磁 盘 或 其 他 存储 介质 上 保存 起 来 的 过 程 。 由 于 磁带 脱 机 存放 ,可 以 不 受 系统 
故障 的 影响 。 这 些 备用 的 数据 称 为 后 备 副本 (Backup) 或 后 援 副 本 。 

当 数 据 库 遭 到 破坏 后 可 以 将 后 备 副本 重新 装 和 ,但 重 装 后 备 副本 只 能 将 数据 库 恢 复 到 
转 储 时 的 状态 ,要 想 恢 复 到 故障 发 生 时 的 状态 ,必须 重新 运行 自转 储 以 后 的 所 有 更 新 事务 。 
下 面 看 一 个 数据 转 储 的 例子 。 

在 图 8-2 中 ,系统 在 T. 时 刻 停止 运行 事务 ,进行 数据 库 转 储 , 在 T, 时 刻 转 储 完 毕 , 得 到 
Ts 时 刻 的 数据 库 一 致 性 副本 。 系 统 运 行 到 Ti 时 刻 发 生 故 障 。 为 恢复 数据 库 , 首 先 由 数据 
库 管理 员 重 装 数据 库 后 备 副本 ,将 数据 库 恢 复 至 Te 时 刻 的 状态 ,然后 重新 运行 自 Th 一 Ti 
时 刻 的 所 有 更 新 事务 ,这样 就 把 数据 库 恢 复 到 故障 发 生前 的 一 致 状态 。 


3 故障 发 生 点 
副本 发 生 点 
于 一 转 储 ns 
正常 
运行 
轴 To Tr 
装 副本 重新 运行 事务 
恢复 | 一 
图 8-2 转 储 与 恢复 


转 储 是 十 分 耗费 时 间 和 系统 资源 的 ,不 能 频繁 进行 。DBA 应 该 根据 数据 库 的 使 用 情况 
确定 一 个 适当 的 转 储 周 期 。 转 储 周 期 可 以 是 几 小 时 、 几 天 ,也 可 以 是 几 周 、 几 个 月 。 

转 储 按 转 储 时 的 状态 分 为 静态 转 储 和 动态 转 储 ; 按 转 储 方式 则 分 为 海量 转 储 与 增 量 转 
储 。 下 面 分 别 加 以 介绍 。 
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2. 静态 转 储 和 动态 转 储 

(1) 静态 转 储 。 系 统 中 无 运行 事务 时 进行 ,系统 只 进行 数据 的 转 储 操作 , 即 转 储 操 作 开 
始 的 时 刻 数据 库 处 于 一 致 性 状态 ,而 转 储 期 间 不 允许 其 他 事物 对 数据 库 进行 任何 存 取 、 
修改 活动 ,数据 库 仍 处 于 一 致 性 状态 。 显 然 ,静态 转 储 得 到 的 一 定 是 一 个 数据 一 致 性 的 
副本 。 

这 种 转 储 方法 实现 简单 ,但 由 于 转 储 必须 等 正 运行 的 用 户 事务 结束 ,同样 ,新 的 事务 必 
须 等 待 转 储 结束 才能 执行 。 显 然 ,这 会 降低 数据 库 系统 的 效率 。 

(2) 动态 转 储 。 转 储 操作 与 用 户 事务 并 发 进行 , 即 转 储 期 间 允 许 其 他 事物 对 数据 库 进 
行 存 取 或 修改 活动 。 这 种 转 储 方法 的 优点 是 不 用 等 待 正在 运行 的 用 户 事务 结束 ,也 不 会 影 
响 新 事务 的 运行 ,但 转 储 结 束 时 后 援 副本 上 的 数据 并 不 能 保证 正确 有 效 , 这 是 动态 转 储 的 不 
足 之 处 。 例 如 ,在 转 储 期 间 的 某 个 时 刻 T,, 系 统 把 数据 A 一 100 转 储 到 磁带 上 ,而 在 下 一 时 
刻 T,, 某 一 事务 将 A 改 为 200。 转 储 结束 后 ,后 备 副本 上 的 A 已 是 过 时 的 数据 了 。 

为 此 ,为 了 克服 动态 转 储 的 不 足 , 必 须 把 转 储 期 间 各 事务 对 数据 库 的 修改 活动 登记 下 
来 ,建立 日 志文 件 。 这 样 ,后 援 副本 加 上 日 志文 件 就 能 把 数据 库 恢复 到 某 一 时 刻 的 正确 
状态 。 

转 储 还 可 以 按 转 储 方式 分 为 海量 转 储 与 增 量 转 储 。 

3. 海量 转 储 和 增 量 转 储 

海量 转 储 是 指 每 次 转 储 全 部 数据 库 ; 增 量 转 储 则 指 每 次 只 转 储 上 一 次 转 储 后 更 新 过 的 
数据 。 

海量 转 储 能 够 得 到 完整 的 后 备 副 本 ,从 恢复 角度 看 ,一 般 来 说 ,用 海量 转 储 得 到 的 后 备 
副本 进行 恢复 会 更 方便 些 。 

但 实际 上 ,数据 库 中 的 数据 一 般 只 部 分 更 新 ,很 少 全 部 更 新 。 因 此 ,可 以 利用 增 量 转 储 ， 
只 转 储 其 修改 过 的 物理 块 ,这 样 转 储 的 数据 量 显著 减少 ,从 而 可 以 减少 发 生 故障 时 的 数据 
丢失 。 

增 量 转 储 更 适合 数据 库 很 大 ,事务 处 理 又 十 分 频繁 的 数据 库 系 统 。 

4. 数据 转 储 方法 

数据 转 储 有 两 种 方式 ,分 别 可 以 在 两 种 状态 下 进行 ,因此 数据 转 储 方法 可 以 分 为 4 类 : 
动态 海量 转 储 、 动 态 增 量 转 储 、 静 态 海量 转 储 和 静态 增 量 转 储 ,如 表 8-1 所 示 。 


表 8-1 数据 转 储 分 类 


转 储 状态 
转 储 方式 
动态 转 储 静态 转 储 
海量 转 储 动态 海量 转 储 静态 海量 转 储 
增 量 转 储 动态 增 量 转 储 静态 增 量 转 储 


8.4.2 日 志文 件 


1. 日 志文 件 定义 
日 志文 件 又 称 数据 库 系 统 日 志 , 简 称 日 志 , 是 用 来 记录 事物 对 数据 库 的 更 改 操作 的 文 
件 。 可 以 使 用 日 志文 件 提供 数据 库 恢 复 时 用 到 的 运行 情况 的 记录 。 为 了 确保 数据 库 总 能 成 


功 恢复 ,日 志 必 须 被 存储 在 永恒 存储 器 中 。 

在 具体 介绍 故障 恢复 操作 之 前 , 先 了 解 几 个 关于 日 志文 件 的 相关 概念 及 事务 运行 状态 
的 变化 。 

(1) 前 像 

当 数 据 库 被 一 个 事务 更 新 时 ,所 涉及 的 物理 块 更 新 前 的 映像 称 为 该 事务 的 前 像 (Before 
Image,BD) ,前 像 以 物理 块 为 单位 。 有 了 前 像 , 如 果 需 要 ,可 以 使 数据 库 恢复 到 更 新 前 的 状 
态 , 即 撤销 更 新 ,这 种 操作 在 恢复 技术 中 称 为 撤销 CUndo) 。 

(2) 后 像 

当 数据 库 被 一 个 事务 更 新 时 ,所 涉及 的 物理 块 更 新 后 的 映像 称 为 事务 的 后 像 (After 
Image,AD) ,后 像 也 以 物理 块 为 单位 。 有 了 后 像 , 即 使 更 新 的 数据 丢失 了 , 仍 可 以 使 数据 库 
恢复 到 更 新 后 的 状态 ,相当 于 重 做 一 次 更 新 ,这 种 操作 在 恢复 技术 中 称 为 重 做 (Redo) 。 

(3) 事务 状态 

记录 每 个 事务 的 状态 ,以 便 在 恢复 时 作 不 同 的 处 理 。 每 个 事务 从 交付 DBMS 到 结束 为 
止 ,其 状态 的 变迁 如 图 8-3 所 示 。 


图 8-3 事务 状态 变迁 图 


活动 状态 : 在 事务 开始 执行 后 ,立即 进入 “活动 状态 ”。 在 活动 状态 ,事务 将 执行 对 数据 
库 的 读 / 写 操作 。 但 “ 写 操作 ”并 不 立即 写 到 磁盘 上 ,很 可 能 暂时 存放 在 系统 缓冲 区 。 

部 分 提交 状态 : 事务 的 最 后 一 个 语句 执行 后 ,进入 “部 分 提交 ”状态 。 此 时 事务 已 经 完 
成 执行 ,但 对 数据 库 的 修改 结果 很 可 能 还 在 内 存 的 系统 缓冲 区 中 ,如 果 此 时 出 现 故障 ,事务 
仍 有 可 能 被 回 深 。 

失败 状态 : 处 于 活动 状态 的 事务 还 没 到 达 最 后 一 个 语句 就 中 止 执行 ,此 时 称 为 事务 进 
入 失败 状态 。 失 败 状态 还 可 以 从 部 分 提交 状态 转 来 ,因为 部 分 提交 状态 下 事务 语句 虽 执 行 
结束 ,但 对 数据 库 的 修改 有 可 能 未 写 到 数据 库 。 

回 滚 状 态 : 事务 失败 后 ,很 可 能 已 对 磁盘 中 的 数据 进行 了 部 分 修改 。 为 了 保证 事务 的 
原子 性 ,应 该 撤销 (Undo) 该 事务 对 数据 库 已 作 的 修改 。 撤 销 操作 称 为 事务 的 回 滚 
(Rollback) 。 提 交 状 态 事务 进入 提交 (Commit) 状态 后 ,把 对 数据 库 的 修改 全 部 写 到 磁盘 
上 ,并 通知 系统 ,事务 成 功 的 结束 ,事务 进入 “结束 ”状态 。 只 有 在 事务 提交 后 ,事务 对 数据 库 
的 更 新 才能 被 其 他 事务 访问 。 

系统 中 的 每 个 事务 必须 处 于 状态 变迁 图 中 的 某 一 个 状态 。 当 数据 库 失效 时 ,可 取出 最 
近 后 备 副本 ,然后 根据 日 志文 件 ,对 未 提交 的 事务 用 前 像 回 深 ; 对 已 提交 的 事务 ,必要 时 用 
后 像 重 做 。 
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2. 日 志文 件 的 格式 和 内 容 

日 志文 件 是 用 来 记录 事务 对 数据 库 的 更 新 操作 的 文件 。 不 同 数据 库 系 统 采 用 的 日 志文 
件 格式 并 不 完全 一 样 。 概 括 起 来 日 志文 件 主 要 有 两 种 格式 : 以 记录 为 单位 的 日 志文 件 和 以 
数据 块 为 单位 的 日 志文 件 。 

(1) 对 于 以 记录 为 单位 的 日 志文 件 ,日 志文 件 中 需要 登记 的 内 容 包 括 : 

O@ 各 个 事务 的 开始 (BEGIN TRANSACTION) 标 记 ; 

@ 各 个 事务 的 结束 (COMMIT 或 ROLLBACK) 标 记 ; 

@ 各 个 事务 的 所 有 更 新 操作 ; 

@ 与 事务 有 关 的 内 部 更 新 操作 。 

这 里 每 个 事务 开始 的 标记 、 结 束 标记 和 每 个 更 新 操作 构成 一 个 日 志 记 录 (Log Record) 。 

每 个 日 志 记 录 的 内 容 包括 : 

Oa 事务 标识 (标明 是 哪个 事务 ); 

@ 操作 的 类 型 (插入 .删除 或 修改 ); 

@ 操作 对 象 ( 记 录 内 部 标识 ); 

@ 更 新 前 数据 的 旧 值 (对 插入 操作 而 言 , 此 项 为 空 值 ); 

@ 更 新 后 数据 的 新 值 (对 删除 操作 而 言 , 此 项 为 空 值 ) 。 

(2) 以 数据 块 为 单位 的 日 志文 件 

对 于 以 数据 块 为 单位 的 日 志文 件 ,日 志 记 录 的 内 容 包 括 事务 标识 和 被 更 新 的 数据 块 。 
由 于 将 更 新 前 的 整个 块 和 更 新 后 的 整个 块 都 放 入 日 志文 件 中 ,操作 类 型 和 操作 对 象 等 信息 
就 不 必 放 和 人 日志 记录 中 了 。 

3. 日 志文 件 的 作用 

具体 作用 如 下 。 

(1) 事务 故障 恢复 和 系统 故障 恢复 必须 用 日 志文 件 。 

(2) 协助 后 备 副本 进行 介质 故障 的 恢复 。 

(3) 在 动态 转 储 方式 中 必须 建立 日 志文 件 ,后 备 副 本 和 日 志文 件 结合 起 来 才能 有 效 地 
恢复 数据 库 。 

(4) 在 静态 转 储 方式 中 也 可 以 建立 日 志文 件 。 当 数据 库 遭 破坏 后 可 重新 装 人 后 援 副 
本 ,把 数据 库 恢复 到 转 储 结束 时 刻 的 正确 状态 ,然后 利用 日 志文 件 把 已 完成 的 事务 进行 重 做 
处 理 , 对 故障 发 生 时 尚未 完成 的 事务 进行 撤销 处 理 。 这 样 不 必 重 新 运行 那些 已 完成 的 事务 
程序 就 可 把 数据 库 恢复 到 故障 前 某 一 时 刻 的 正确 状态 ,如 图 8-4 所 示 。 


正常 运行 小 一 前 态 转 储 ! 运行 事务 | 
人 Uy 登记 日 志文 件 下 
介质 故障 恢复 村 要 后 备 副 本 | _ 利 用 日 志文 件 恢复 。___| 继续 运行 _ 
登记 日 志文 件 


图 8-4 利用 日 志文 件 恢复 


4. 登记 日 志文 件 

为 保证 数据 库 是 可 恢复 的 ,登记 日 志文 件 时 必须 遵循 两 条 原则 : 

(1) 登记 的 次 序 严格 按 并 发 事务 执行 的 时 间 次 序 ; 

(2) 必须 先 写 日 志文 件 ,后 写 数 据 库 。 

说 明 : 把 对 数据 的 修改 写 到 数据 库 中 和 把 记录 这 个 修改 的 日 志 记 录 写 到 日 志文 件 中 是 
两 个 不 同 的 操作 。 如 果 在 这 两 个 操作 之 间 发 生 故 障 , 就 可 能 导致 这 两 个 写 操作 只 完成 了 一 
个 。 如 果 先 写 了 数据 库 修改 ,而 在 运行 记录 中 没有 登记 下 这 个 修改 , 则 以 后 就 无 法 恢复 这 个 
修改 了 。 但 是 如 果 先 写 日 志文 件 ,没有 修改 数据 库 , 按 日 志文 件 恢 复 时 只 不 过 是 多 执行 一 次 
不 必要 的 Undo 操作 ,并 不 会 影响 数据 库 的 正确 性 。 因 此 为 了 数据 库 的 安全 ,一 定 要 先 写 日 
志文 件 , 即 首先 把 日 志 记录 写 到 日 志文 件 中 ,然后 再 进行 数据 库 的 修改 。 这 就 是 “ 先 写 日 志 
文件 ”的 原则 。 

这 种 以 后 备 副 本 和 日 志文 件 为 基础 的 恢复 技术 ,可 使 数据 库 恢复 至 最 近 的 一 致 状态 ,在 
数据 库 系 统 中 用 得 最 多 ,大 部 分 商品 化 的 DBMS 都 支持 这 种 恢复 技术 。 但 这 种 恢复 技术 必 
须 有 数据 库 运 行情 况 的 记录 ,因此 需要 花费 较 大 的 存储 空间 ,而 且 也 影响 数据 库 正 常 的 
性 能 。 


8.5 数据 库 恢 复 策略 


1. 事务 内 部 故障 的 恢复 

事务 运行 至 正常 结束 前 被 中 止 , 则 出 现 事务 故障 。 一 旦 出 现 事务 故障 ,这 时 恢复 子 系统 
将 根据 日 志文 件 对 出 现 故障 的 事务 进行 Undo 操作 ,撤销 该 事务 对 数据 库 已 经 进行 的 修改 。 
系统 的 恢复 步骤 是 ， 

(1) 由 后 向 前 扫描 日 志文 件 ,查找 出 现 故障 事务 对 数据 进行 的 更 新 操作 ， 

(2) 为 每 个 更 新 操作 执行 其 逆 操 作 , 即 将 更 新 前 的 旧 值 重新 写 和 数据库。 如 果 记 录 是 
插入 操作 , 则 相当 于 做 删除 操作 ; 若 记 录 是 删除 操作 , 则 做 插入 操作 ; 若是 修改 操作 , 则 相 
当 于 用 修改 前 的 旧 值 代替 修改 后 的 新 值 ; 

(3) 继续 扫描 日 志文 件 ,对 该 事务 的 每 个 更 新 操作 进行 恢复 ,直至 读 到 此 事务 的 开始 标 
记 , 事 务 故障 恢复 就 完成 了 。 

事务 故障 的 恢复 是 由 数据 库 管 理 系统 自动 完成 的 ,对 用 户 是 透明 的 。 

2. 系统 故障 的 恢复 

前 面 已 讲 过 ,发 生 系统 故障 时 ,未 完成 的 事务 对 数据 库 的 部 分 更 新 可 能 已 经 完成 并 写 人 
数据 库 , 已 完成 的 事务 对 数据 库 的 更 新 可 能 留 在 缓冲 区 中 还 没有 写 和 人 数据库 ,因此 恢复 操作 
就 是 要 撤销 故障 发 生 时 未 完成 的 事务 , 重 做 已 完成 的 事务 。 

系统 的 恢复 步骤 如 下 。 

(1) 从 前 向 后 扫描 日 志文 件 , 找 出 故障 发 生前 已 经 完成 的 事务 (这 些 事务 既 有 BEGIN 
TRANSACTION 记录 ,也 有 COMMIT 记录 ) ,将 其 事务 标识 记 入 Redo 队列 。 同 时 找 出 故 
障 发 生 时 尚未 完成 的 事务 (这 些 事务 只 有 BEGIN TRANSACTION 记录 ,无 相应 的 
COMMIT 记录 ) ,将 其 事务 标识 记 入 Undo 队列 。 

(2) 对 于 Undo 队列 中 的 事务 进行 撤销 ,方法 是 从 后 向 前 扫描 日 志文 件 中 每 个 Undo 事 
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务 的 操作 ,对 每 个 撤销 事务 的 更 新 操作 执行 逆 操 作 , 即 将 日 志 记录 中 “更 新 前 的 值 ?" 写 人 数 
据 库 。 

(3) 对 于 Redo 队列 中 的 事务 进行 重 做 ,方法 是 正 向 扫描 日 志文 件 , 对 每 个 重 做 事务 重 
新 执行 日 志文 件 登记 的 Redo 事务 的 操作 。 即 将 日 志 记 录 中 “更 新 后 的 值 " 写 入 数据 库 。 

系统 故障 的 恢复 是 由 数据 库 管理 系统 在 重新 启动 时 自动 完成 的 ,不 需要 用 户 干 预 。 

3. 介质 故障 恢复 

发 生 介质 故障 后 ,磁盘 上 的 物理 数据 和 日 志文 件 被 破坏 ,这 是 最 严重 的 一 种 故障 ,恢复 
方法 是 重 装 数据 库 , 然 后 重 做 已 完成 的 事务 。 

(1) 装 和 最 新 的 数据 库 后 备 副本 ( 离 故障 发 生 时 刻 最 近 的 转 储 副 本 ) ,使 数据 库 恢 复 到 
最 近 一 次 转 储 时 的 一 致 性 状态 。 

对 于 动态 转 储 的 数据 库 副 本 ,还 需 同 时 装 和 人 转 储 开始 时 刻 的 日 志文 件 副本 ,利用 恢复 系 
统 故 障 的 方法 ( 即 Redo 十 Undo) ,才能 将 数据 库 恢复 到 一 致 性 状态 。 

(2) 装 和 人 相应 的 日 志文 件 副本 ( 转 储 结束 时 刻 的 日 志文 件 副本 ), 重 做 已 完成 的 事务 。 
即 : 首先 扫描 日 志文 件 , 找 出 故障 发 生 时 已 提交 的 事务 的 标识 ,将 其 记 入 重 做 队列 ; 然后 正 
向 扫描 日 志文 件 ,对 重 做 队列 中 的 所 有 事务 进行 重 做 处 理 。 即 将 日 志 记 录 中 “更 新 后 的 值 ” 
写 人 数据 库 。 

这 样 就 可 以 将 数据 库 恢 复 至 故障 前 某 一 时 刻 的 一 致 状态 了 。 

介质 故障 的 恢复 需要 DBA 介入 。 但 DBA 只 需要 重 装 最 近 转 储 的 数据 库 副 本 和 有 关 
的 各 日 志文 件 副本 ,然后 执行 系统 提供 的 恢复 命令 即 可 ,具体 的 恢复 操作 仍 由 DBMS 完成 。 


8.6 具有 检查 点 的 恢复 技术 


利用 日 志 对 数据 库 系 统 进 行 恢 复 时 ,恢复 子 系统 首先 要 搜索 日 志文 件 , 确 定 哪些 事务 需 
要 Redo ,哪些 事务 需要 Undo。 一 般 来 说 ,系统 需要 检查 所 有 日 志 记 录 。 这 样 做 存在 以 下 两 
个 问题 : 

Q@ 搜索 整个 日 志 将 耗费 大 量 的 时 间 ; 

@ 一 旦 事物 提交 (Commit) ,很 多 需要 Redo 处 理 的 事务 实际 上 已 经 将 它们 的 更 新 操作 
写 到 数据 库 中 了 ,然而 恢复 子 系统 又 Redo 该 事务 ,同样 会 造成 空间 上 和 时 间 上 不 必要 的 浪 
费 。 为 了 解决 这 些 问 题 , 引 入 了 具有 检查 点 的 恢复 技术 。 这 种 方法 使 系统 在 执行 期 间 动态 
地 维护 系统 日 志 , 并 且 在 日 志文 件 中 增加 了 一 类 新 的 记录 一 一 检查 点 记录 (Check Point) 。 
即 对 日 志文 件 周 期 性 地 执行 检查 点 。 

检查 点 也 称 安全 点 ,恢复 点 。 当 事务 正常 运行 时 ,数据 库 系统 按 给 定 的 时 间 间 隔 设 检查 
点 。 一 旦 系统 需要 恢复 数据 库 状态 ,就 可 以 根据 最 新 的 检查 点 的 信息 ,从 检查 点 开始 执行 ， 
ole sted 

检查 点 可 以 作为 一 类 新 的 日 志 记 录 写 在 日 志文 件 中 ,增加 一 个 重新 开始 文件 ,并 让 恢复 
子 系统 在 登录 日 志文 件 期 间 动态 地 维护 日 志 。 

1. 检查 点 记录 的 主要 内 容 

(1) 建立 检查 点 时 所 有 正在 执行 的 事务 清单 ; 

(2) 这 些 事务 最 近 一 个 日 志 记 录 的 地 址 。 


重新 开始 文件 用 来 记录 各 个 检查 点 记录 在 日 志文 件 中 的 地 址 。 

2. 动态 维护 日 志文 件 的 方法 

(1) 建立 检查 点 ; 

(2) 保存 数据 库 状态 。 

动态 维护 日 志文 件 的 具体 步骤 如 下 : 

@ 将 当前 日 志 缓 冲 区 中 的 所 有 日 志 记 录 写 人 磁盘 的 日 志文 件 上 ; 

@ 在 日 志文 件 中 写 人 一 个 检查 点 记录 ; 

@ 将 当前 数据 缓冲 区 的 所 有 数据 记录 写 入 磁盘 的 数据 库 中 ; 

@ 把 检查 点 记录 在 日 志文 件 中 的 地 址 写 入 一 个 重新 开始 文件 。 

建立 检查 点 Ci 时 ,对 应 的 日 志文 件 和 重新 开始 文件 示例 ,如 图 8-5 所 示 。 


日 志文 作 “< 


重新 开始 文件 


@ Ci 的 检查 点 记录 地 


Ci 的 检查 点 记录 地 址 、 


图 8-5 具有 检查 点 的 日 志文 件 和 重新 开始 文件 


系统 可 以 定期 或 不 定期 地 建立 检查 点 。 检 查 点 可 以 根据 预定 的 时 间 间 隔 建立 ,如 每 隔 
一 个 小 时 建立 一 个 检查 点 ; 也 可 以 根据 某 种 规则 建立 检查 点 ,如 日 志文 件 写 满 一 半 时 建立 
一 个 检查 点 。 

3. 具有 检查 点 的 数据 库 恢 复 策略 

对 在 检查 点 之 前 提交 的 事务 T, 即 在 日 志 中 ,记录 <T,commit > 出 现在 < check point > 
之 前 。 使 用 检查 点 方法 ,T 对 数据 库 做 的 修改 一 定 都 已 写 人 数据 库 , 写 人 时 间 是 在 这 个 检查 
点 建立 之 前 或 在 这 个 检查 点 建立 之 时 ,这 样 ,在 进行 恢复 处 理 时 ,没有 必要 对 该 事务 执行 
Redo。 使 用 检查 点 方法 可 以 改善 之 前 介绍 的 数据 库 恢复 系统 的 效率 。 

在 系统 出 现 故障 时 ,恢复 子 系统 根据 事务 的 不 同 状态 可 以 采取 不 同 的 恢复 策略 ,如 
图 8-6 所 示 。 

各 事务 说 明 如 下 : 

Tl 在 检查 点 之 前 提交 ; 

T2 在 检查 点 之 前 开始 执行 ,在 检查 点 之 后 故障 点 之 前 提交 ; 

T3 在 检查 点 之 前 开始 执行 ,在 故障 点 时 还 未 完成 ; 

T4 在 检查 点 之 后 开始 执行 ,在 故障 点 之 前 提交 ; 

T5 在 检查 点 之 后 开始 执行 ,在 故障 点 时 还 未 完成 。 
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检查 点 Te 系统 故障 Ti 
= 时 间 
Tl 7 不 重 做 
| 
T4 a 
| T3 _ 本 
Ts ] 撤销 


图 8-6 具有 检查 点 的 数据 库 恢 复 策略 


恢复 策略 如 下 : 

T3 和 T5 在 故障 发 生 时 还 未 完成 ,所 以 予以 Undo; 

T2 和 T4 在 检查 点 之 后 才 提交 ,它们 对 数据 库 所 做 的 修改 在 故障 发 生 时 可 能 还 在 缓冲 
区 中 ,尚未 写 和 数据库, 所 以 要 Redo; 

T1 在 检查 点 之 前 已 提交 ,所 以 不 必 执 行 重 做 操作 。 

4. 系统 使 用 检查 点 方法 进行 恢复 

(1) 从 重新 开始 文件 中 找到 最 后 一 个 检查 点 记录 在 日 志文 件 中 的 地 址 ,由 该 地 址 在 日 
志文 件 中 找到 最 后 一 个 检查 点 记录 。 

(2) 由 该 检查 点 记录 得 到 检查 点 建立 时 刻 所 有 正在 执行 的 事务 清单 ACTIVE-LIST。 
建立 两 个 事务 队列 : 

Q@ Undo-LIST 需要 执行 Undo 操作 的 事务 集合 ; 

@ Redo-LIST 需要 执行 Redo 操作 的 事务 集合 。 

把 ACTIVE-LIST 暂时 放 入 Undo-LIST 队列 ,Redo 队列 暂 为 空 。 

(3) 从 检查 点 开始 正 向 扫描 日 志文 件 。 

@ 如 有 新 开始 的 事务 Ti ,把 Ti 暂时 放 入 Undo-LIST 队列 ， 

@ 如 有 提交 的 事务 Ti ,把 Ti 从 Undo-LIST 队列 移 到 Redo-LIST 队列 ; 

@ 重复 上 述 步 骤 , 直 到 日 志文 件 结束 。 

(4) 对 Undo-LIST 中 的 每 个 事务 执行 Undo 操作 ,对 Redo-LIST 中 的 每 个 事务 执行 
Redo 操作 。 

总 结 上 述 的 恢复 策略 如 下 : 

当 故 障 发 生 后 ,可 以 通过 检查 日 志 来 确定 在 最 近 的 检查 点 建立 前 开始 执行 的 最 近 的 一 
个 事务 T;。 要 找到 这 个 事务 只 需 从 日 志 的 尾部 由 后 向 前 搜索 日 志 , 直到 找到 第 一 个 < check 
point > 记录 (其 实 就 是 日 志文 件 中 的 最 后 一 个 < check point >)。 然 后 继续 向 前 搜索 直至 发 
现 第 一 个 < Ti ,start > 记录 ,事务 Ti 就 是 检查 点 建立 之 前 开始 运行 的 最 后 一 个 事务 ,只 需 对 
事务 Ti 和 事务 Ti 后 开始 执行 的 所 有 事务 执行 Redo 和 Undo 操作 , 即 可 实现 数据 库 恢 复 事 
务 Ti 及 其 后 开始 执行 的 事务 构成 一 个 事务 集合 T ,TeET'。 如 果 日 志文 件 中 包含 < Ti， 
commit >, 则 对 T; 执行 Redo 操作 。 否 则 ,对 Ti 执行 Undo 操作 。 

【 例 1】 在 如 下 日 志文 件 中 ,如 果 检 查 点 设置 在 < Ts ,commit > 之 前 ,出 现 故障 并 排除 
后 ,由 于 事务 Ti 在 检查 点 之 前 已 经 提交 ,因此 不 必 执 行 任何 操作 ; 事务 T, 在 检查 点 之 后 、 
故障 发 生前 提交 ,需要 进行 Redo 操作 实现 数据 库 的 恢复 ; 而 事务 Ts 在 发 生 故 障 时 没有 提 


交 , 因 此 执行 Undo 操作 。 


<T1, start> 

<T1,A,100,110> 

<T1,B,200,180> 

<T1,commit> 

<T2, start > 

<T2,C,x,290> /*x 表 示 数 据 项 C 的 旧 值 */ 
<T3,start> 

< check point > 

< T2,commit> 

<T3,C, 290, 390> 


发 生 故障 。 


8.7 数据 库 镜像 


如 前 所 述 , 介 质 故 障 是 对 系统 影响 最 为 严重 的 一 种 故障 。 系 统 出 现 介质 故障 后 ,用 户 应 
用 全 部 中 断 ,恢复 起 来 也 比较 费时 。 故 DBA 必须 周期 性 地 转 储 数据 库 , 如 果 不 及 时 而 正确 
地 转 储 数据 库 ,一旦 发 生 介质 故障 ,会 造成 较 大 的 损失 。 

随 着 技术 的 发 展 ,磁盘 容量 越 来 越 大 ,价格 越 来 越 便宜 。 为 避免 磁盘 介质 出 现 故障 影响 
数据 库 的 可 用 性 ,许多 DBMS 提供 了 数据 库 镜 像 (Mirror) 功 能 用 于 数据 库 恢复 。 其 方法 是 
DBMS 根据 DBA 的 要 求 , 自 动 把 整个 数据 库 或 其 中 的 关键 数据 复制 到 另 一 个 磁盘 上 ,并 自 
动 保证 镜像 数据 与 主 数据 的 一 致 性 ,如 图 8-7(a) 所 示 。 即 每 当主 数据 库 更 新 时 ,DBMS 自 
动 把 更 新 后 的 数据 复制 过 去 。 

一 旦 出 现 介质 故障 ,可 由 镜像 磁盘 继续 提供 使 用 ,同时 DBMS 自动 利用 镜像 磁盘 数据 
进行 数据 库 的 恢复 ,不 需要 关闭 系统 和 重 装 数据 库 副本 ,如 图 8-7(b) 所 示 。 


韦 
update 


(a) 


update 
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在 没有 出 现 故障 时 ,数据 库 镜像 还 可 以 用 于 并 发 操作 , 即 当 一 个 用 户 对 数据 加 排他 锁 修 
改 数据 时 ,其 他 用 户 可 以 读 镜像 数据 库 上 的 数据 ,而 不 必 等 待 该 用 户 释 放 锁 。 

双 磁 盘 镜 像 技术 (Mirrored Disk) 常 用 于 可 靠 性 要 求 高 的 数据 库 系统 。 数 据 库 以 双 副 
本 的 形式 存放 在 两 个 独立 的 磁盘 系统 中 ,每 个 磁盘 系统 有 各 自 的 控制 器 和 CPU, 且 可 以 互 
相 自动 切换 。 

由 于 数据 库 镜 像 是 通过 复制 数据 实现 的 ,频繁 地 复制 数据 自然 会 降低 系统 运行 效率 , 因 
此 在 实际 应 用 中 用 户 往往 只 选择 对 关键 数据 和 日 志文 件 进行 镜像 ,而 不 是 对 整个 数据 库 进 
行 镜像 。 


8.8 小 结 


保证 数据 一 致 性 是 对 数据 库 的 最 基本 的 要 求 。 事 务 是 数据 库 的 逻辑 工作 单位 ,只 要 数 
据 库 管 理 系 统 能 够 保证 系统 中 一 切 事务 的 ACID 特性 , 即 事务 的 原子 性 、 一 致 性 .隔离 性 和 
持续 性 ,也 就 保证 了 数据 库 处 于 一 致 状态 。 

但 故障 是 数据 库 系统 无 法 避免 的 ,一 旦 出 现 故障 ,就 可 能 破坏 数据 库 的 一 致 性 。 因 此 数 
据 库 管 理 系统 必须 提供 故障 恢复 机 制 。 本 章 介 绍 了 事务 故障 、 系 统 故障 和 介质 故障 以 及 出 
现 这 些 故障 时 数据 库 系 统 的 常用 恢复 技术 。 数 据 转 储 和 登记 日 志文 件 是 恢复 中 最 经 常 使 用 
的 技术 。 恢 复 的 基本 原理 就 是 利用 存储 在 后 备 副本 日 志文 件 和 数据 库 镜像 中 的 宛 余 数据 
来 重建 数据 库 。 在 基于 日 志 恢复 数据 库 时 ,引入 了 检查 点 的 概念 ,恢复 时 没有 必要 扫描 整个 
日 志文 件 ,而 只 需 执行 检查 点 即 可 得 到 需要 恢复 的 事务 。 最 后 介绍 了 针对 介质 故障 的 数据 
库 镜像 技术 。 

事务 不 仅 是 恢复 的 基本 单位 ,也 是 并 发 控制 的 基本 单位 。 为 了 保证 事务 的 隔离 性 和 一 
致 性 ,DBMS 需要 对 并 发 操作 进行 控制 。 下 一 章 将 介绍 并 发 控制 技术 。 


习 题 


1. 名 词 解释 与 理解 

事务 ,事务 提交 ,事务 回 滚 , 事 务 恢复 ,系统 日 志 , 活 锁 , 数 据 库 镜 像 

2. 试 述 事务 的 4 个 特性 。 恢 复 技 术 能 保证 事务 的 哪些 特性 ? 

3. 事务 执行 结果 有 哪 两 种 状态 ? 每 一 种 状态 对 事务 操作 的 影响 和 数据 库 的 影响 如 何 ? 

4. 什么 是 数据 库 的 恢复 ? 恢复 实现 的 技术 有 哪些 ? 

5. 针对 不 同 的 故障 , 试 给 出 恢复 的 策略 和 方法 。 即 如 何 进 行事 务 故 障 的 恢复 ,如 何 进 
行 系统 故障 的 恢复 ,以 及 如 何 进行 介质 故障 的 恢复 。 

6. 系统 日 志 在 事务 恢复 中 的 作用 是 什么 ? 检查 点 又 是 指 什么 ? 它 在 事务 恢复 中 能 够 
起 到 什么 作用 ? 

7. 写 一 个 修改 到 数据 库 中 和 写 一 个 表示 这 个 修改 的 日 志 记 录 到 日 志 中 是 两 个 不 同 的 
操作 ,这 两 个 操作 中 哪 一 个 应 该 先 做 而 且 更 重要 些 ? 为 什么 ? 

8. 考虑 如 下 所 示 的 日 志 记 录 : 


序号 日 志 序号 日 志 
于 Ti : 开始 8 T;: 开始 
加 Ti: 写 A,A=10 9 Ts: 写 A,C=8 
3 T: : 开始 10 Tz:: 回 滚 
4 T:: 写 B,B 一 9 11 T;: 写 B,B 一 7 
每 Ti: 写 C,C=11 12 T,: 开始 
6 Ti : 提交 13 Ts : 提交 
妆 T:: 写 C,C=13 14 Ti: 写 C,C=12 


(1) 如 果 系 统 故障 发 生 在 14 之 后 ,说 明 哪 些 事务 需要 Redo ,哪些 事务 需要 Undo? 
(2) 如 果 系 统 故障 发 生 在 10 之 后 ,说 明 哪 些 事务 需要 Redo, 哪 些 事务 需要 Undo? 
(3) 如 果 系 统 故障 发 生 在 9 之 后 ,说 明 哪些 事务 需要 Redo ,哪些 事务 需要 Undo? 
(4) 如 果 系统 故障 发 生 在 7 之 后 ,说明 哪 些 事务 需要 Redo ,哪些 事务 需要 Undo? 
9. 考虑 题 4 所 示 的 日 志 记 录 , 假 设 开始 时 A、B、C 的 值 都 是 0: 
(1) 如 果 系 统 故 障 发 生 在 14 之 后 , 写 出 系统 恢复 后 A、B.C 的 值 ; 
(2) 如 果 系 统 故 障 发 生 在 12 之 后 , 写 出 系统 恢复 后 A、B、C 的 值 ; 
(3) 如 果 系 统 故障 发 生 在 10 之 后 , 写 出 系统 恢复 后 A、B、C 的 值 ; 


(4) 如 果 系 统 故障 发 生 在 9 之 后 ， 


系统 恢复 后 A、B、C 的 值 ; 


写 | 
(5) 如 果 系 统 故障 发 生 在 7 之 后 , 写 出 系统 恢复 后 A、B、C 的 值 ; 
(6) 如 果 系 统 故障 发 生 在 5 之 后 , 写 出 系统 恢复 后 A、B、C 的 值 。 
10. 什么 是 检查 点 记录 ? 检查 点 记录 包括 哪些 内 容 ? 具有 检查 点 的 恢复 技术 有 什么 


优点 ? 


11. 试 述 使 用 检查 点 方法 进行 恢复 的 步骤 。 
12. 什么 是 数据 库 镜 像 ?y” 它 有 什么 用 途 ? 


数据 亩 恢复 技术 


地 oo 颈 


第 9 章 并 发 控制 


【本 章 主要 内 容 】 

1. 简要 介绍 几 类 并 发 操作 导致 的 数据 库 不 一 致 性 问题 。 
.重点 阐述 并 发 控制 的 主要 技术 之 一 一 一 封锁 。 

.着 重 介绍 三 级 封锁 协议 内 容 。 

.对 活 锁 和 死 锁 的 概念 及 解决 方法 作 一 般 性 介绍 。 
.简介 并 发 调度 的 可 串 行 性 及 两 段 锁 协 议 。 


9.1 并 发 控制 概述 


之 前 介绍 数据 库 系 统 的 特点 之 一 是 数据 的 共享 性 , 即 数据 可 以 被 多 个 用 户 、 多 个 应 用 共 
享 使 用 。 允 许多 个 用 户 同时 使 用 同一 个 数据 库 的 数据 库 系统 称 为 多 用 户 数据 库 系统 。 例 如 
订 票 数据 库 系统 、 银 行 数据 库 系 统 等 都 是 多 用 户 数据 库 系统 。 在 这 样 的 系统 中 ,在 同一 时 刻 
并 发 运行 的 事务 数 可 达成 百 上 千 个 。 

数据 库 中 的 事务 的 执行 可 以 分 为 两 种 方式 : 一 种 是 串 行 执行 ; 一 种 是 并 和 
简单 了 解 一 下 这 两 种 方式 的 执行 过 程 和 特点 。 

(1) 串 行 执行 : 执行 过 程 为 每 个 时 刻 只 有 一 个 事务 运行 ,其 他 事务 必须 等 到 这 个 事务 
结束 以 后 方 能 运行 ,如 图 9-1(a) 所 示 。 特 点 是 系统 资源 利用 率 低 。 这 是 由 于 事务 在 执行 过 
程 中 需要 不 同 的 资源 ,有 时 需要 CPU, 有 时 需要 存 取 数 据 库 , 有 时 需要 I/O, 有 时 需要 通信 。 
如 果 事 务 串 行 执 行 , 则 许多 系统 资源 将 处 于 空闲 状态 。 短 事务 可 能 需 较 长 时 间 等 待 长 事务 
的 完成 , 串 行 执行 有 可 能 导致 难以 预测 的 延迟 。 

因此 ,为 了 充分 利用 系统 资源 ,发 挥 数 据 库 共享 资源 的 特点 ,事务 处 理 系统 通常 允许 多 
个 事务 并 发 执行 ,这 样 可 以 交叉 地 利用 硬件 资源 和 数据 资源 ,有 利于 提高 系统 的 资源 利用 
率 。 男 外 ,并 发 执行 可 以 减少 不 可 预测 的 事务 的 执行 延迟 ,也 可 以 减少 一 个 事务 从 开始 执行 
到 完成 所 需 的 平均 时 间 。 

(2) 并 行 执行 : 执行 过 程 分 两 种 ,一 种 是 在 单 处 理 机 系统 中 ,事务 的 并 行 执行 实际 上 是 
这 些 并 行事 务 的 并 行 操作 轮流 交叉 运行 ,如 图 9-1(b) 所 示 。 这 种 并 行 执行 方式 称 为 交叉 并 
发 方式 (Interleaved Concurrency)。 第 二 种 是 在 多 处 理 机 系统 中 ,每 个 处 理 机 可 以 运行 一 个 
事务 ,多 个 处 理 机 可 以 同时 运行 多 个 事务 ,这 种 并 行 执行 方式 称 为 同时 并 发 方式 
(Simultaneous Concurrency) 。 这 是 多 个 事务 真正 的 并 行 运 行 方式 。 

本 章 讨论 的 数据 库 系 统 并 发 控制 (Concurrency Control in Database Systems) 技 术 是 以 
单 处 理 机 系统 为 基础 的 ,该 理论 可 以 推广 到 多 处 理 机 的 情况 。 虽然 单 处 理 机 系统 中 的 并 行 
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事务 并 没有 真正 地 并 行 运 行 ,但 是 减少 了 处 理 机 的 空闲 时 间 ,提高 了 系统 的 效率 。 


全 二 Ts 
nL 
Ti T> | 
1 
| ] 
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(a) 事务 的 串 行 执行 方式 (b) 事务 的 交叉 并 发 执行 方式 
图 9-1 事务 的 执行 方式 


当 多 个 用 户 并 发 地 存 取 数 据 库 时 就 可 能 产生 多 个 事务 同时 存 取 同一 数据 的 情况 。 如 果 
对 并 发 操作 不 加 控制 就 可 能 会 存 取 和 存储 不 正确 的 数据 ,事务 的 ACID 特性 可 能 遭 到 破坏 
并 且 导 致 数据 库 的 不 一 致 性 。 因 此 为 了 保证 事务 的 隔离 性 和 一 致 性 ,数据 库 管 理 系统 需要 
对 并 发 操作 进行 正确 调度 , 即 数据 库 管理 系统 必须 提供 并 发 控制 机 制 ,控制 不 同事 务 之 间 的 
相互 影响 ,防止 数据 库 的 一 致 性 遭 到 破坏 。 并 发 控制 机 制 是 衡量 一 个 数据 库 管理 系统 性 能 
的 重要 标志 之 一 。 

本 节 主 要 介绍 如 何 利用 并 发 控制 (Concurrency-control) 机 制 实现 多 用 户 对 数据 的 并 发 
访问 控制 。 允 许多 个 事务 同时 对 数据 库 进 行 操作 。 

下 面 先 来 看 一 个 经 典 的 并 发 访问 例子 一 一 民航 飞机 订 票 系统 中 的 订 票 业务 ,说 明 并 发 
操作 可 能 带 来 的 数据 的 不 一 致 性 问题 。 

【 例 1】 假设 有 两 个 旅客 在 不 同 的 机 票 销售 地 点 同时 预定 同一 个 航班 的 飞机 票 , 分 别 
视 这 两 个 订 票 操作 为 事务 T 和 事务 T: 。 

下 面 是 这 两 名 旅客 订 票 的 一 个 活动 序列 : 

事务 Ti : 甲 售票 员 读 出 某 航班 的 机 票 余额 A, 设 A 二 10。 

@ 事务 T,: 乙 售票 员 读 出 同一 航班 的 机 票 余额 A,A 一 10。 

@ 事务 Ti , 甲 售 票 员 卖 出 一 张 机 票 ,修改 机 票 余额 A 一 A 一 1, 所 以 A=9, 把 A 写 入 数 
据 库 。 

@ 事务 Ts : 乙 售票 员 卖 出 2 张 机 票 ,修改 机 票 余额 A<—A 一 2, 所 以 A=8, 把 A 写 入 数 
据 库 。 

从 最 后 的 结果 来 看 ,总 共 卖 出 去 3 张 票 ,结果 数据 库 中 的 余 票 应 该 为 7 张 ,但 实际 上 机 
票 余额 却 为 8。 这 是 由 于 两 个 事务 并 发 执行 ,对 同一 个 数据 同时 进行 更 新 ,造成 数据 库 中 数 
据 的 不 一 致 性 。 这 就 是 有 名 的 民航 订 票 问题 。 

事务 的 并 发 操作 引起 的 数据 库 的 不 一 致 主要 体现 在 丢失 修改 、 读 “ 脏 ” 数 据 和 不 可 重复 
读 。 下 面 分 别 讨论 事务 并 发 执行 可 能 产生 的 这 几 种 错误 。 

(1) 丢失 修改 (Lost Update) 是 指 两 个 事务 T， 和 T。 从 数据 库 中 读 入 同一 数据 并 修改 ， 
Ts 提交 的 结果 破坏 了 T 提交 的 结果 ,导致 Ti 的 修改 被 丢失 ,如 图 9-2 所 示 。 前 面 的 民航 
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售票 是 一 个 典型 的 并 发 执行 所 引起 的 不 一 致 例子 ,其 主要 原因 就 是 “丢失 修改 ”。 

丢失 修改 是 由 于 两 个 事务 对 同一 个 数据 并 发 写 人 而 造成 的 ,也 称 为 “ 写 - 写 "冲突 。 

(2) 读 * 脏 ”数据 ,又 称 " 脏 ? 读 (Dirty Read) ,是 指 事务 Ti 修改 某 一 数据 ,并 将 其 写 回 磁 
盘 , 事 务 T, 读 取 同 一 数据 后 ,Ti 由 于 某 种 原因 被 撤销 ,这 时 Ti 已 修改 过 的 数据 恢复 原 值 ， 
T; 读 到 的 数据 就 与 数据 库 中 的 数据 不 一 致 , 则 Ts 读 到 的 数据 就 为 “ 脏 " 数 据 , 即 不 正确 的 数 
据 。 此 种 操作 称 为 读 * 脏 "数据 。 如 图 9-3 中 ,T 将 B 值 修改 为 20,T; 读 到 B 为 20, 而 TT 
由 于 某 种 原因 撤销 ,之 前 的 修改 作废 ,B 恢复 原 值 10, 这 时 Ts 读 到 的 B 为 20, 与 数据 库 内 
容 不 一 致 ,就 是 “ 脏 ” 数 据 。 


Ti 监 
加 读 B=10 
@ 读 4=10 2 
写 回 B 
回 读 4=10 
4 一 4 SW 
写 回 4=9 @4-4.2 ROLLBACK 
3 写 回 4=8 ; 8 恢复 为 10 
图 9-2 丢失 修改 国 93 被 " 阴 " 激 所 


读 * 脏 ”数据 的 原因 是 由 于 一 个 事务 读 另 个 更 新 事务 尚未 提交 的 数据 所 引起 的 , 称 为 
“ 读 - 写 ”冲突 。 

(3) 不 可 重复 读 (Non-Repeatable Read) 是 指 事务 Ti 读 取 数据 后 ,事务 T, 执行 更 新 操 
作 , 使 Ti 无 法 再 现 前 一 次 读 取 结 果 。 不 可 重复 读 包括 三 种 情况 。 

Oz 事务 Ti 读 取 某 一 数据 后 ,事务 Ts。 对 其 做 了 修改 , 当 事 务 T, 再 次 读 该 数据 时 ,得 到 
与 前 一 次 不 同 的 值 。 例 如 在 图 9-4 中 ,T, 读 取 B= 二 20 进行 运算 ,T, 读 取 并 对 其 进行 修改 ， 
将 B==40 写 回 数据 库 。T 为 了 对 读 取 值 校对 重新 读 取 B,B 现在 已 经 改 为 40 ,与 第 一 次 读 
取 值 不 一 致 

@) 事务 T 按 一 定 条 件 从 数据 库 中 读 取 了 某 些 数据 记录 后 ,事务 T。 删除 了 其 中 部 分 记 
录 , 当 T 再 次 按 相 同 条 件 读 取 数 据 时 ,发 现 某 些 记录 神秘 地 消失 了 。 

@ 事务 Ti 按 一 定 条 件 从 数据 库 中 读 取 某 些 数据 记录 后 ,事务 T 插入 了 一 些 记 录 , 当 
Ti 再 次 按 相同 条 件 读 取 数 据 时 ,发 现 多 了 一 些 记录 。 


Ti T» 
= 不 可 重复 读 的 原因 是 由 * 读 - 写 "冲突 所 引起 。 
Ce 从 以 上 分 析 可 知 ,并 发 操作 所 引起 的 问题 ,主要 来 自 
A418-30 | wp_y0。 | 于 并 发 执行 的 事务 对 同一 数据 对 象 的 * 写 - 写 "冲突 和 * 读 - 


8~B*2 | 写 ” 冲 突 , 且 问题 主要 出 在 “ 写 ”" 上 ,只 “ 读 ” 事 务 并 发 执行 不 
号 加 2740 | 会 发 生 问 题 。 


es 三 类 数据 不 一 致 性 的 示例 如 图 9-2、 图 9-3、 图 9-4 所 
AtB-50 示 。 产 生 这 三 种 错误 的 主要 原因 是 违反 了 事务 ACID 中 
(验算 不 对 ) 


的 4 项 原则 ,特别 是 隔离 性 原则 。 为 保证 事务 并 发 执行 的 
图 9-4 不 可 重复 读 正确 ,必须 要 有 一 定 的 调度 手段 以 保障 事务 并 发 执行 中 每 


一 事务 在 执行 时 不 受 事务 的 影响 。 并 发 控制 就 是 要 用 正确 的 方式 调度 并 发 操作 ,使 一 个 用 
户 事务 的 执行 不 受 其 他 事务 的 干扰 ,从 而 避免 造成 数据 的 不 一 致 性 。 
对 数据 库 的 应 用 有 时 允许 某 些 不 一 致 性 ,例如 有 些 统计 工作 涉及 数据 量 很 大 , 读 到 一 些 
“ 脏 ” 数 据 对 统计 精度 影响 很 小 ,这 时 可 以 通过 降低 对 一 致 性 的 要 求 进而 减少 系统 的 开销 。 
并 发 控制 采用 的 主要 技术 是 封锁 (Locking) 技 术 、 时 间 蕉 (Timestamp)、 乐 观 控制 法 
(Optimistic Scheduler) 和 多 版 本 并 发 控制 (Multi-Version Concurrency Control, MVCC) 
等 。 本 章 只 介绍 众多 数据 库 产品 采用 的 基本 方法 一 一 封锁 方法 ,以 下 介绍 封锁 的 相关 内 容 。 


9.2 ”封锁 与 封锁 协议 


9.2.1 封锁 的 概念 


封锁 是 实现 并 发 控制 的 一 个 非常 重要 的 技术 。 所 谓 封锁 就 是 当 事 务 了 在 对 某 个 数据 
对 象 (例如 表 、 记 录 等 ) 操 作 之 前 , 先 向 系统 发 出 请 求 ,对 其 加 锁 。 加 锁 后 事务 T 就 对 该 数据 
对 象 有 了 一 定 的 控制 ,在 事务 T 释放 它 的 锁 之 前 ,其 他 事务 不 能 更 新 此 数据 对 象 。 只 有 对 
该 数据 对 象 操作 完毕 并 解除 对 数据 的 封锁 后 , 才 允 许 其 他 事务 对 该 数据 进行 操作 。 例 如 ,在 
例 1 中 ,事务 T, 要 修改 A, 若 在 读 出 A 前 先 锁 住 A ,其 他 事务 就 不 能 再 读 取 和 修改 A 了, 直 
到 Ti 修改 并 写 回 A 后 解除 了 对 A 的 封锁 为 止 。 这 样 ,就 不 会 丢失 Ti 的 修改 。 

确切 的 控制 由 封锁 类 型 决定 。 给 数据 对 象 加 锁 的 方式 有 多 种 ,基本 的 封锁 类 型 有 两 
种 : 排他 锁 (Exclusive Locks) 和 共享 锁 (Share Locks) ,排他 锁 简 称 为 X 锁 ,共享 锁 简称 为 
S 锁 。 

排他 锁 又 称 为 写 锁 。 若 事务 对 数据 对 象 A 加 上 X 锁 ( 即 Xlock A), 则 只 允许 T 读 取 
和 修改 A, 其 他 任何 事务 都 不 能 再 对 A 加 任何 类 型 的 锁 , 直 到 工 释放 A 上 的 锁 为 止 。 这 就 
保证 了 其 他 事务 在 T 释放 A 上 的 锁 之 前 不 能 再 读 取 和 修改 A。 

共享 锁 又 称 为 读 锁 。 若 事务 T 对 数据 对 象 A 加 上 S 锁 ( 即 Slock A) , 则 事务 T 可 以 读 
A 但 不 能 修改 A ,其 他 事务 只 能 再 对 A 加 S 锁 ,而 不 能 加 X 锁 , 直 到 全 释放 A 上 的 S 锁 。 
这 就 保证 了 其 他 事务 可 以 读 A, 但 在 工 释放 A 上 的 S 锁 之 前 不 能 对 A 作 任何 修改 。 共 享 锁 
保护 数据 对 象 不 被 写 ,但 可 以 同时 读 。 两 种 封锁 示意 图 如 图 9-5 所 示 。 

加 加 X 锁 。 T 可 读 、 可 写 4 


个 加 S 锁 。 T 可 读 、 不 可 写 4 


@ 可 加 s 锁 、 
Ti 不 可 读 、 不 可 写 4 禁止 加 X 锁 人 可 读 、 不 可 写 4 


外 禁止 加 锁 


(a) X 锁 (b) S 锁 
9-5 ”两 种 方式 示意 图 


排他 锁 与 共享 锁 的 控制 方式 可 以 用 表 9-1 所 示 的 相 容 矩阵 (Compatibility Matrix) 来 
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表 9-1 封锁 类 型 的 相 容 和 矩阵 
卫 事 务 的 锁 请 求 
A 


/ \ 
T 次 S 

专 

事 

务 X N 过 

己 

拥 

1 S N 

饥 一 过 到 有 


在 表 9-1 中 ,和 矩阵 中 最 左边 一 列表 示 事 务 Ti 已 经 获得 的 数据 对 象 上 的 锁 的 类 型 ; 最 上 
面 一 行 表示 另 一 事务 T, 对 同一 数据 对 象 发 出 的 封锁 请 求 。T。 的 请 求 能 否 被 满足 ,用 和 矩阵 
中 的 Y 和 NN 表示 。Y 表示 Yes, 表 示 相 容 的 请 求 ,封锁 请 求 可 以 满足 ; N 表示 No, 表 示 不 相 
容 的 请 求 ,Ts 的 要 求 被 拒绝 ;“ 一 ”表示 未 加 锁 。 

例如 ,如 果 事 务 T, 已 拥有 X 锁 ,此 时 事务 Ts。 申请 X 锁 不 被 允许 ,所 以 对 应 的 值 为 N 
(第 1 行 ,第 1 列 ); 

如 果 事 务 Ti 已 拥有 X 锁 ,此 时 事务 Ts 申请 S 锁 不 被 允许 ,所 以 对 应 的 值 为 N( 第 1 
行 ,第 2 列 ); 

如 果 事 务 Ti 已 拥有 S 锁 ,此 时 事务 Ts 申请 XX 锁 不 被 允许 ,所 以 对 应 的 值 为 N( 第 2 
行 ,第 1 列 ); 

如 果 事 务 T 已 拥有 S 锁 , 此 时 事务 T, 申请 S 锁 则 被 允许 ,所 以 对 应 的 值 为 Y( 第 2 
行 ,第 2 列 )，; 

如 果 事 务 Ti 未 加 任何 锁 , 此 时 T* 事务 无 论 申请 X 锁 还 是 S 锁 都 被 允许 ,所 以 对 应 的 
值 都 为 "Y”( 第 3 行 各 列 )。 

从 以 上 讨论 可 知 ,由 于 S 锁 只 用 于 读 ,同一 数据 对 象 可 允许 多 个 事务 并 发 读 ,从 而 提高 
了 并 发 操作 的 程度 。 


9.2.2 封锁 协议 


封锁 协议 是 指 在 运用 X 锁 和 S 锁 这 两 种 基本 封锁 对 数据 对 象 加 锁 时 ,还 需要 约定 一 些 
规则 ,加 锁 是 为 了 实现 并 发 控制 。 例 如 : 何 时 申请 X 锁 或 S 锁 、 持 锁 时 间 、 何 时 释放 等 。 对 
封锁 方式 制定 不 同 的 规则 ,就 形成 了 各 种 不 同 的 封锁 协议 (Locking Protocol) 。 封 锁 协 议 一 
共 分 三 级 。 这 些 协议 在 不 同 程度 上 可 以 解决 对 并 发 操作 的 不 正确 调度 可 能 带 来 的 丢失 修 
改 , 不 可 重复 读 和 * 脏 ? 读 等 不 一 致 性 问题 ,为 并 发 操作 的 正确 调度 提供 一 定 的 保证 。 不 同 级 
别 的 封锁 协议 达到 的 系统 一 致 性 级 别 是 不 同 的 。 

保持 到 事务 结束 时 才 释 放 的 锁 称 作 长 锁 。 在 事务 中 途 就 可 以 释放 的 锁 称 作 短 锁 。 下 面 
分 别 介绍 三 级 封锁 协议 。 

1. 一 级 封锁 协议 

一 级 封锁 协议 是 指 , 事 务 T 在 修改 数据 R 之 前 必须 先 对 其 加 X 锁 ,直到 事务 结束 才 释 
放 。 事 务 结束 包括 正常 结束 (COMMIT) 和 非 正常 结束 (ROLLBACK) 。 

作用 : 一 级 封锁 协议 可 防止 丢失 修改 ,并 保证 事务 T 是 可 恢复 的 。 例 如 图 9-6 使 用 一 


级 封锁 协议 解决 了 图 9-2 中 的 丢失 修改 问题 。 

在 图 9-2 中 ,事务 Ti 读数 据 之 前 没有 加 锁 ,事务 T。 又 从 数据 库 中 读 人 同一 数据 并 修 
改 , 事 务 Ts 的 提交 结果 覆盖 (破坏 ) 了 事务 T 提交 的 结果 ,导致 事务 Ti 的 修改 丢失 。 而 在 
图 9-6 中 ,由 于 事务 Ti 在 修改 数据 对 象 A 之 前 先 对 其 申请 了 X 锁 , 直 到 事务 结束 才 释 放 。 
在 此 期 间 , 事 务 Ts 申请 封锁 数据 对 象 A 不 被 批准 ,直到 事务 Ti 结束 ( 即 COMMIT) 后 才 获 
得 锁 ,才能 读 取 并 修改 同一 数据 对 象 。 这 时 它 读 到 的 A 已 经 是 Ti 更 新 过 的 值 9, 再 按 此 新 
的 A 值 进 行 运算 ,并 将 结果 值 A=7 写 回 到 磁盘 。 这 样 就 避免 了 丢失 Ti 的 修改 。 

在 一 级 封锁 协议 中 ,如 果 仅 仅 是 读数 据 而 不 对 其 进行 修改 ,是 不 需要 加 锁 的 ,所 以 它 不 
能 保证 可 重复 读 和 不 读 * 脏 ”数据 。 

在 图 9-6 中 ,lock 表示 加 锁 ,unlock 表示 解锁 ,commit 表示 事务 正常 结 

2. 二 级 封锁 协议 

二 级 封锁 协议 是 指 ,在 一 级 封锁 协议 基础 上 增加 事务 T, 在 读 取 数 据 B 之 前 必须 先 对 
其 加 S 锁 , 读 完 后 即 可 释放 S 锁 。 此 种 封锁 方式 与 一 级 封锁 协议 联合 构成 了 二 级 封锁 协议 。 

作用 : 二 级 封锁 协议 除 防止 了 丢失 修改 ,还 可 进一步 防止 读 “ 脏 ”数据 。 例 如 图 9-7 使 
用 二 级 封锁 协议 解决 了 图 9-3 中 的 “ 脏 ” 读 的 问题 。 

在 图 9-7 中 ,事务 T 在 对 B 进行 修改 之 前 , 先 对 B 加 X 锁 ,修改 其 值 后 写 回 磁盘 。 这 
时 Ts 请 求 在 B 上 加 S 锁 , 因 T 已 在 B 上 加 了 X 锁 ,Ts 只 能 等 待 。Ti 因 某 种 原因 (例如 数 
据 库 故 障 ) 被 撤 ,B 恢复 为 原 值 50.T 释放 B 上 的 X 锁 后 ,Ts 获得 在 数据 对 象 B 上 的 S 锁 ， 
读 B= 二 50。 这 就 避免 了 了 T, 读 “ 脏 ”数据 。 

在 二 级 封锁 协议 中 ,由 于 读 完 数据 后 即 可 释放 S 锁 , 所 以 它 不 能 保证 可 重复 读 。 


T Ts 
Ti T: DXlock B 
读 B=50 
了 获得 Xlock 4 BB*2 
3 读 4=10 写 回 B=100 
HAA-1 人 你 @Slock 8 
写 回 4=9 等 待 等 待 
commit 等 待 等 待 
, unlock 4 a (OROLLBACK | 等 竺 
加 获得 Xlock 4 (8B 恢复 为 50) 
读 4=9 Unlock B 
A—A-2 了 获得 Slock B 
@@ 写 回 4=7 @@ 读 B=50 
commit commit B 
1 unlock A ‘y unlock B 
9-6 一 级 封锁 协议 可 以 防止 丢失 修改 9-7 ”使 用 二 级 封锁 协议 可 防止 “ 脏 ” 读 


3. 三 级 封锁 协议 
三 级 封锁 协议 是 指 ,在 一 级 封锁 协议 的 基础 上 增加 事务 T 对 数据 A 作 读 操作 前 必须 先 
对 A 加 S 锁 ,直到 事务 结束 才能 释放 加 在 A 上 的 S 锁 。 此 种 封锁 方式 与 一 级 封锁 协议 联合 
构成 了 三 级 封锁 协议 。 
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作用 : 由 于 三 级 加 锁 协 议 对 事务 进行 全 程 加 锁 ( 包 括 


X 锁 \S 锁 ) ,因此 ,不 仅 不 委 失 修改 ,不 读 * 胜 "数据 外 ,还 ， | 2 
进一步 防止 了 不 可 重复 读 。 例 如 图 9-8 使 用 三 级 封锁 协 | | 4 
议 解 决 了 图 9-4 不 可 重复 读 问题 。 Siock B 

图 9-8 中 ,事务 Ti 在 读 A、B 之 前 , 先 对 A.B 加 S | 

求 和 =150 |@xlock B 

锁 ,这 样 其 他 事务 只 能 再 对 A.B 加 S 锁 ,而 不 能 加 XX 锁 ， 等待 
即 其 他 事务 只 能 读 A、B, 而 不 能 修改 它们 。 所 以 当 T, 为 
修改 B 而 申请 对 B 的 X 锁 时 被 拒绝 ,只 能 等 待 T, 释放 了 
上 的 锁 。Ti 为 验算 再 读 A、B, 这 时 B 仍 是 100, 求 和 结果 om 
仍 为 150, 即 可 重复 读 。 事 务 Ti 结束 后 才 释放 A、B 上 的 ontoek3 | Galock 8 
S 锁 ,Ts 才 获 得 对 B 的 X 锁 。 读 B=100 

上 述 三 级 协议 的 主要 区 别 在 于 什么 操作 需要 申请 封 ns 
锁 , 以 及 何 时 释放 锁 ( 即 持 锁 时 间 )。 三 级 封锁 协议 可 以 eommit 


‘i unlock B 


总 结 为 表 9-2。 表 中 还 指出 了 不 同 的 封锁 协议 使 事务 达 
到 的 一 致 性 是 不 同 的 ,封锁 协议 级 别 越 高 ,一 致 性 程度 。 图 9-8 三 级 加 锁 协议 可 防止 


越 高 。 数据 不 可 重复 读 
表 9-2 “不同 级 别 的 封锁 协议 和 一 致 性 保证 
X 锁 S 锁 一 致 性 保证 
级 别 ”| 操作 结束 | 事务 结束 | 操作 结束 | 事务 结束 | 不 丢失 | 不 读 “ 脏 ”| 可 重复 

释放 释放 释放 释放 修改 数据 读 
一 级 封锁 协议 V V 
二 级 封锁 协议 V 不 a 
三 级 封锁 协议 V/ V V/ V V/ 


三 级 封锁 协议 是 事务 T 在 读 取 数 据 之 前 必须 先 对 其 加 S 锁 , 在 修改 数据 之 前 必须 先 对 
其 加 和 X 锁 ,直到 事务 结束 才 释 放 所 有 的 锁 。 

封锁 由 DBMS 统一 管理 。DBMS 提供 一 个 锁 表 ,记载 各 个 数据 对 象 加 锁 的 情况 。 事 务 如 
果 需 要 对 某 数据 对 象 进行 操作 , 须 先 向 DBMS 提出 申请 。DBMS 根据 锁 表 的 状态 和 加 锁 协 议 ， 
同意 其 申请 或 令 其 等 待 。 锁 表 是 DBMS 的 公共 资源 ,而 且 访 问 频繁 ,一 般 置 于 公共 内 存 区 。 

锁 表 的 内 容 仅 反映 数据 资源 使 用 的 暂时 状态 ,如 果 系 统 失效 , 锁 表 的 内 容 也 将 随 之 失 
效 ,无 保留 价值 。 


9.3 活 锁 和 死 锁 


和 操作 系统 一 样 ,加 锁 技术 虽然 可 以 有 效 地 解决 并 发 操作 带 来 的 一 系列 问题 ,但 同时 也 
会 带 来 一 些 新 的 问题 ,如 死 锁 与 活 锁 问题 。 
9.3.1 活 锁 


1. 活 锁 产生 的 原因 
如 果 事 务 T, 封锁 了 数据 对 象 A, 事 务 T, 又 请 求 封 锁 A, 于 是 T 等 待 ; 之 后 T; 也 请 求 


封锁 A, 当 Ti 释放 了 A 上 的 封锁 之 后 系统 首先 批准 了 Ts 的 请 求 ,Ts 仍然 等 待 ; 然后 T 又 
请 求 封锁 A, 当 Ts 释放 了 A 上 的 封锁 之 后 系统 又 批准 了 T 的 请 求 ……T, 有 可 能 永远 等 
待 ,这 就 是 活 锁 的 情形 ,如 图 9-9 所 示 的 活 锁 示例 。 

活 锁 又 称 饿 死 , 是 由 于 事务 永远 得 不 到 封锁 而 导致 的 。 


T T: Ts T, 
Lock A 加 
Lock A 

等 待 Lock A 
等 待 Lock A 

Unlock A 等 待 ow” 等 待 
等 待 Lock A 等 待 
等 待 Lock A 
等 待 Lock A 
等 待 


图 9-9 活 锁 的 示例 


2. 活 锁 解决 的 办 法 

为 了 避免 活 锁 ,在 加 锁 协 议 中 应 规定 “ 先 申 请 , 先 服务 ”First Come,First Served) 原 则 ， 
即 先 来 先 服务 。 当 多 个 事务 请 求 封锁 同一 数据 对 象 时 ,封锁 子 系统 按 请 求 封锁 的 先后 次 序 
对 事务 排队 ,数据 对 象 上 的 锁 一 旦 释放 就 批准 申请 队列 中 第 一 个 事务 获得 封锁 的 资格 。 


9.3.2 无 镇 


1. 死 锁 产 生 的 原因 

在 数据 库 中 ,产生 死 锁 的 原因 是 两 个 或 多 个 事务 都 已 封锁 了 一 些 数据 对 象 ,然后 又 都 请 
求 对 已 被 其 他 事务 封锁 的 数据 对 象 加 锁 ,从 而 出 现 死 等 待 。 当 事务 中 出 现 循环 等 待 时 ,如 果 
不 加 干预 , 则 会 一 直 等 待 下 去 ,使 得 事务 无 法 继续 执行 。 

下 面 举例 说 明 什 么 是 死 锁 。 如 图 9-10 所 示 , 事 务 T 封锁 了 数据 对 象 A,T, 封锁 了 数 
据 对 象 B, 然 后 T, 又 请 求 封锁 B, 因 T, 已 封 了 B, 于 是 Ti 等 待 T, 释放 B 上 的 锁 ; 接着 Ts 
又 请 求 封锁 A, 因 Ti 封锁 了 A,T。 只 能 等 待 Ti 释放 A 上 的 锁 。 这 样 就 出 现 了 Ti; 在 等 待 
Ts ,而 T: 又 在 等 待 Ti 的 情况 , Ti 和 T: 两 个 事务 由 于 互相 等 待 对 方 释放 数据 对 象 上 的 锁 
而 永远 不 能 继续 执行 ,这样 就 出 现 了 死 锁 。 


T T; 

Lock A 加 
Lock B 

Lock B 

等 待 

等 待 

等 待 Lock A 

等 待 等 待 

等 待 等 待 

图 9-10 死 锁 
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多 种 事务 交错 等 待 的 僵持 局 面 称 为 死 锁 ,关于 死 锁 的 问题 在 操作 系统 和 一 般 并 行 处 理 
中 已 做 了 深入 研究 ,目前 在 数据 库 中 解决 死 锁 问题 主要 有 两 类 方法 。 

。 防止 死 锁 : 这 类 方法 防止 死 锁 的 发 生 其 实 就 是 要 破坏 产生 死 锁 的 条 件 ,采取 一 定 措 

施 来 预防 死 锁 的 发 生 。 防 止 死 锁 的 方法 和 操作 系统 中 资源 管理 类 似 。 
。 检测 死 锁 ,发 现 死 锁 后 处 理 死 锁 : 这 类 方法 是 允许 发 生死 锁 ,但 定期 诊断 系统 中 是 
和 否 出 现 死 锁 , 若 出 现 , 则 人 为 地 解除 它 。 

2. 死 锁 的 预防 

死 锁 预防 机 制 的 基本 思想 是 避免 并 发 事务 互相 等 待 其 他 事务 释放 封锁 的 情况 出 现 , 保 
证 系统 永 不 进入 死 锁 状 态 。 预 防 死 锁 方法 主要 有 一 次 封锁 法 和 顺序 封锁 法 两 种 。 

(1) 一 次 封锁 法 

一 次 封锁 法 要 求 每 个 事务 开始 执行 之 前 必须 一 次 将 所 有 要 使 用 的 数据 对 象 全 部 加 锁 ， 
否则 ,该 事务 就 不 能 继续 执行 。 图 9-10 的 例子 中 ,如 果 事 务 T 将 数据 对 象 A 和 B 一 次 加 
锁 ,Ti 就 可 以 执行 下 去 ,而 Ts 等 待 。T; 执行 完 后 释放 A 和 B 上 的 锁 ,T; 继续 执行 。 这 样 
就 不 会 发 生死 锁 。 

一 次 封锁 法 虽然 可 以 有 效 地 防止 死 锁 的 发 生 , 但 也 存在 以 下 问题 : 第 一 ,降低 数据 的 
使 用 效率 和 系统 的 并 发 度 。 因 为 一 次 就 将 以 后 要 用 到 的 全 部 数据 加 锁 ,势必 扩大 了 封锁 
的 范围 ; 第 二 ,数据 库 中 数据 是 不 断 变化 的 ,原来 不 要 求 封锁 的 数据 在 执行 过 程 中 可 能 会 
变 成 封锁 对 象 ,所 以 很 难事 先 精确 地 确定 每 个 事务 所 要 封锁 的 所 有 数据 对 象 ,为 此 只 能 
扩大 封锁 范围 ,将 事务 在 执行 过 程 中 可 能 要 封锁 的 数据 对 象 全 部 加 锁 , 这 就 进一步 降低 
了 并 发 度 。 

(2) 顺序 封锁 法 

顺序 封锁 法 是 预先 对 数据 对 象 规定 一 个 封锁 顺序 ,所 有 事务 都 按 这 个 顺序 实施 封锁 。 
例如 在 BB 树 结构 的 索引 中 ,可 规定 封锁 的 顺序 必须 是 从 根 节 点 开始 ,然后 是 下 一 级 的 子女 
节点 , 逐 级 封锁 。 

顺序 封锁 法 同样 是 预防 死 锁 的 有 效 方法 ,但 也 同样 存在 以 下 问题 : 第 一 ,数据 对 象 的 封 
锁 顺 序 需要 预先 规定 ,这 本 身 就 是 一 件 非常 困难 的 事情 。 因 为 数据 库 系 统 中 封锁 的 数据 对 
象 极 多 ,并 且 随 着 不 断 地 对 数据 进行 各 类 操作 (数据 的 插入 删除 等 操作 ) 而 不 断 地 变化 ,对 
于 数据 对 象 的 封锁 顺序 需要 不 断 地 进行 维护 ,以 保证 系统 最 大 程度 地 预防 死 锁 的 发 生 ,造成 
维护 成 本 的 增加 ; 第 二 ,事务 的 封锁 请 求 可 以 随 着 事务 的 执行 而 动态 地 决定 ,很 难事 先 确定 
每 一 个 事务 要 封锁 哪些 对 象 ,因此 也 就 很 难 按 规定 的 顺序 去 施加 封锁 。 

可 见 ,无论 是 一 次 封锁 法 还 是 顺序 封锁 法 ,都 存在 着 一 定 的 问题 ,在 操作 系统 中 广泛 采 
用 的 预防 死 锁 的 策略 并 不 太 适 合 数据 库 的 特点 ,因此 ,数据 库 系统 普遍 采用 诊断 并 解除 死 锁 
的 方法 。 

3. 死 锁 的 诊断 与 解除 

(1) 死 锁 的 诊断 

数据 库 系 统 中 诊断 死 锁 的 方法 与 操作 系统 类 似 , 一 般 使 用 超时 法 或 事务 等 待 图 法 。 

Oy 超时 法 

如 果 一 个 事务 的 等 待 时 间 超 过 了 规定 的 时 限 ,就 认为 发 生 了 死 锁 。 超 时 法 实现 简单 ,但 
其 不 足 也 很 明显 , 即 超时 时 间 的 设置 比较 困难 。 因 为 死 锁 发 生 后 , 须 等 待 一 定 的 时 间 才 能 被 


发 现 , 而 且 事务 因 其 他 原因 (如 系统 负荷 太 重 ,通信 受阻 等 ) 而 使 事务 等 待 时 间 超过 时 限 , 也 
可 能 被 误 判 为 死 锁 。 这 样 如 果 超 时 时 间 设 置 较 短 , 则 这 种 误 判 的 死 锁 会 增多 ; 但 如 果 超 时 
时 间 设 置 较 长 , 死 锁 发 生 后 不 能 及 时 发 现 ,造成 系统 资源 的 浪费 。 因 此 ,时 限 须 根据 系统 运 
行情 况 通 过 试验 确定 。 

@ 等 待 图 法 

事务 等 待 图 是 一 个 有 向 图 G 二 (T,E),T 为 节点 的 集合 ,每 个 节点 表示 正 运行 的 事务 
E 为 边 的 集合 ,每 条 边 表示 事务 等 待 的 情况 。 若 T; 在 等 待 Ti 释放 数据 对 象 的 封锁 , 则 在 
Ti 、T 之 间 画 一 条 有 向 边 ,从 T; 指向 Ti ,表示 为 : Ti 一 Ti。 

如 果 事 务 Ti 对 数据 对 象 R 进行 了 封锁 ,这 时 ,事务 T; 请 求 封锁 R, 则 在 事务 等 待 图 中 
存在 从 事务 T; 到 Ti 的 一 条 有 向 边 , 从 T, 指向 T;。 当 T; 释放 加 在 R 上 的 封锁 后 ,将 这 条 
有 向 边 从 事务 等 待 图 中 删除 。 

如 果 事 务 T; 和 Ti 都 互相 等 待 对 方 释放 加 在 所 需 数据 项 上 的 封锁 ,事务 等 待 图 中 一 定 
同时 存在 从 T; 指向 T; 和 从 Ti 指向 T; 的 有 向 边 , 这 样 就 形成 了 环 。 当 事务 等 待 图 中 包含 
环 时 ,就 发 生 了 死 锁 。 

图 9-11(a) 表 示 事 务 Ti 等 待 T, ,Ts 又 等 待 Ti ,产生 了 环 ( 回 路 ) ,因此 发 生 了 死 锁 。 

而 图 9-11(b) 表 示 事 务 Ti 等待 T: ,Ti 还 等 待 Ti ,Ts 等 待 Ti ,T;: 等 待 Ti ,在 这 个 事务 
等 待 图 中 不 包含 回路 ,当然 ,不 会 产生 死 锁 。 但 是 死 锁 的 情况 可 以 多 种 多 样 , 例 如 ,图 9-11(c) 
中 事务 Ti 等 待 Ts ,T: 等 待 Ti ,Ts 等待 Ti,T: 还 等 待 T,。 在 事务 等 待 图 中 包含 了 环 : 
Ti 一 T 一 Ti 一 Ti , 则 意味 着 Ti .Ts .T; 都 处 于 死 锁 状态 。 这 些 情 况 人 们 都 已 经 做 了 很 深入 
的 研究 。 


oo od be 


图 9-11 死 锁 示例 


事务 等 待 图 动态 地 反映 了 所 有 事务 的 等 待 情况 。 并 发 控制 子 系统 根据 锁 申请 和 加 锁 的 
情况 ,周期 性 (比如 每 隔 数 秒 ) 动 态 地 维护 一 个 等 待 图 ,并 进行 检测 。 当 且 仅 当 图 中 存在 回 
路 , 则 表示 系统 中 出 现 了 死 锁 。 

(2) 死 锁 的 解除 

数据 库 管理 系统 的 并 发 控制 子 系统 一 旦 检测 到 系统 中 存在 死 锁 , 必 须 采 取 一 定 的 措施 
设法 解除 。 通 常 采用 的 方法 是 选择 一 个 死 锁 代价 最 小 的 事务 ,将 其 撤销 ,将 这 个 事务 对 数据 
对 象 的 封锁 进行 释放 ,使 需要 这 些 对 象 的 其 他 事务 得 以 继续 运行 下 去 。 当 然 , 对 撤销 的 事务 
所 执行 的 数据 修改 操作 必须 加 以 恢复 。 

采用 选择 部 分 事务 回 深 的 方法 解除 死 锁 可 能 会 导致 “ 饿 死 "* 问 题 , 即 每 次 回 深 都 选择 同 
一 个 事务 ,该 事务 可 能 永远 得 不 到 运行 。 因 此 ,在 选择 回 深 事 务 的 时 候 还 需要 考虑 该 事务 已 
经 回 滚 的 次 数 。 
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9.4 并 发 调度 的 可 串 行 性 


9.4.1 事务 执行 的 几 种 方法 


在 多 个 应 用 中 ,多 个 事务 的 执行 有 以 下 几 种 不 同方 法 。 

(1) 串 行 执行 : 这 是 一 种 能 保证 事务 的 正确 执行 的 方法 。 即 以 事务 为 单位 ,多 个 事务 
依次 顺序 执行 ,此 种 执行 称 为 串 行 执行 。 

(2) 并 发 执行 : 也 是 以 事务 为 单位 ,多 个 事务 按 一 定 调度 策略 同时 执行 ,此 种 执行 称 为 
并 发 执行 。 

(3) 并 发 执行 的 可 串 行 化 : 数据 库 管理 系统 对 并 发 事务 不 同 的 调度 可 能 会 产生 不 同 的 
结果 , 即 事务 的 并 发 执行 并 不 能 保证 事务 正确 性 ,那么 什么 样 的 调度 是 正确 的 呢 ? 显然 , 串 
行 调度 是 正确 的 ,或 者 执行 结果 等 价 于 串 行 执行 的 调度 也 是 正确 的 。 因 此 需要 采用 一 定 的 
技术 ,使 得 在 并 发 执行 时 像 串 行 执行 时 一 样 ,此 种 执行 称 为 并 发 事务 的 可 串 行 化 
CSerializable) 调 度 ,而 所 采用 的 技术 则 称 为 并 发 控制 (Concurrency Control) 技 术 。 


9.4.2 事务 的 调度 与 冲突 


具有 什么 样 性 质 的 调度 是 可 串 行 化 的 调度 ?如 何 判 断 调 度 是 可 串 行 化 的 调度 ”本 节 给 
出 判断 可 串 行 化 调度 的 充分 条 件 。 首 先 介绍 调度 的 概念 。 

1. 调度 

就 是 安排 多 个 并 发 事务 的 执行 顺序 。n 个 事务 Ti ,Ts ,…,T, 的 调度 S 是 这 ?个 事务 
的 一 个 执行 顺序 。 这 n 个 事务 的 调度 需要 服从 下 述 约束 : S 中 事务 T; 操作 的 执行 顺序 , 必 
须 与 单个 T; 执行 时 操作 的 执行 顺序 相同 ; 调度 S 中 其 他 事务 Ti 的 操作 可 以 与 T; 的 操作 
交错 执行 。 


2. 冲突 操作 

冲突 操作 是 指 不 同 的 事务 对 同一 个 数据 的 读 写 操作 和 写 写 操作 , 即 有 如 下 表示 : 
Ri(x) 与 是 (x) /* 事 务 T; 读 x,T 写 x, 其 中 i 隐 j*/ 

而 (x) 与 W(x) /* 事务 T, 写 xm 写 x, 其 中 i 关 j。 


换 句 话说 ,就 是 某 个 调度 中 的 两 个 操作 同时 满足 如 下 三 个 条 件 , 就 说 这 两 个 操作 是 冲 


疲 
到 


中 它们 属于 不 同事 务 。 

@ 它们 访问 同一 个 数据 项 。 

加 两 个 操作 中 至 少 有 一 个 是 写 操作 。 
其 他 操作 都 是 不 冲突 操作 。 


9.4.3 冲突 的 可 串 行 化 调度 


如 果 调 度 S 中 每 个 事务 T 的 操作 在 调度 中 都 是 连续 执行 的 ,那么 就 称 调度 S 是 串 行 
的 ; 否则 ,调度 S 就 是 非 串 行 的 。 因 此 在 串 行 调度 中 ,一 个 时 刻 只 有 一 个 事务 处 于 活动 状 
态 , 串 行 调 度 不 会 发 生 不 同事 务 操作 的 交错 。 如 果 假 设 事务 是 相互 独立 的 ,那么 每 个 串 行 的 


调度 都 是 正确 的 ,因此 哪 一 个 事务 先 执行 都 是 无 关 紧 要 的 。 虽 然 串 行 调度 能 够 保障 事务 处 
理 的 正确 性 ,但 串 行 调度 限制 了 事务 的 并 发 或 操作 的 交错 ,降低 了 CPU 的 吞吐 率 即 系统 的 
效率 。 因 此 ,实际 应 用 中 应 尽量 避免 使 用 。 

在 非 串 行 调度 中 ,需要 确定 哪些 调度 能 得 到 正确 结果 ,而 哪些 调度 得 到 错误 结果 。 这 就 
是 所 谓 的 调度 可 串 行 性 问题 。 

多 个 事务 的 并 发 执行 是 正确 的 , 当 且 仅 当 其 结果 与 按 某 一 次 序 串 行 地 执行 它们 时 的 结 
果 相 同 ,人 们 称 这 种 调度 策略 为 可 串 行 化 的 调度 。 

一 个 给 定 的 并 发 调度 , 当 且 仅 当 它 是 可 串 行 化 的 , 才 认为 是 正确 的 调度 。 

如 果 一 个 具有 nn 个 事务 的 调度 S 等 价 于 某 个 由 相同 n 个 事务 组 成 的 串 行 调度 ,那么 S 
就 是 可 串 行 化 的 。 可 串 行 化 调度 能 够 有 效 实现 事务 的 并 发 ,并 且 保 证 事务 操作 的 正确 性 ,为 
了 提高 数据 库 系 统 事务 执行 效率 ,应 尽量 让 多 个 事务 并 发 操作 。 

为 了 保证 并 发 操作 的 正确 性 ,DBMS 的 并 发 控制 机 制 必 须 提供 一 定 的 手段 来 保证 调度 
是 可 串 行 化 的 。 目 前 DBMS 普遍 采用 封锁 方法 实现 并 发 操作 调度 的 可 串 行 性 ,从 而 保证 调 
度 的 正确 性 。 

不 同事 务 的 冲突 操作 和 同一 事务 的 两 个 操作 是 不 能 交换 (swap) 的 。 对 于 Ri(z) 与 
Wi(z) ,车 改变 二 者 的 次 序 , 则 事务 Ti 看 到 的 数据 库 状态 就 发 生 了 改变 ,自然 会 影响 事务 
T; 后 面 的 行为 。 对 于 Wi(z) 与 Wj;(zx) ,改变 二 者 的 次 序 也 会 影响 数据 库 的 状态 ,zx 的 值 由 
等 于 Ti 的 结果 变 成 等 于 T 的 结果 。 

一 个 调度 Sc 在 保证 冲突 操作 的 次 序 不 变 的 情况 下 ,通过 交换 两 个 事务 不 冲突 操作 的 次 
序 得 到 另 一 个 调度 Sc', 如 果 Sc' 是 串 行 的 , 称 调度 Sc 为 冲突 可 串 行 化 的 调度 。 若 一 个 调度 
是 冲突 可 串 行 化 , 则 一 定 是 可 串 行 化 的 调度 。 因 此 可 以 用 这 种 方法 来 判断 一 个 调度 是 否 是 
可 串 行 化 调度 。 

可 串 行 性 (Serializability) 是 并 发 事务 正确 调度 的 准则 。 按 这 个 准则 规定 ,一 个 给 定 的 
并 发 调度 , 当 且 仅 当 它 是 可 串 行 化 的 , 才 认 为 是 正确 调度 。 下 面 给 出 了 串 行 执行 、 不 正确 的 
并 发 执行 以 及 可 串 行 化 的 并 发 执行 的 例子 。 

【 例 2】 以 银行 转账 为 例 , 现 在 有 两 个 事务 ,分 别 包含 下 列 操作 

事务 T : R(A); A 二 A 一 10000; W(A); RCB);，B=B 二 10000; W(B)。 说明: 事务 
Ti 从 账号 A 转 10000 至 账号 B; 

事务 Ts: R(A); X=A*x0.1; A=A 一 X; W(A); R(B); B= 二 B 十 X; W(B)。 说 明 : 
和 务 T。 从 账号 A 转 10% 的 款项 至 账号 B。 

其 具体 的 程序 及 其 不 同 的 调度 执行 如 下 : 

在 图 9-12(a) 和 图 9-12(b) 中 ,假设 A、B 的 初 值 均 为 20000。 按 Ti 一 T: 次 序 执行 结果 
为 A 二 9000,B 二 31000; 按 Ti 一 Ti 次 序 执行 结果 为 A 王 8000,B 王 32000。 两 个 事务 分 别 串 
行 执行 ,不 管 其 先后 次 序 执行 结果 都 是 正确 的 . 即 账号 A 与 B 的 存款 总 和 均 为 40000, 保 持 
了 其 一 致 性 。 

在 图 9-12(c) 和 图 9-12(d) 中 则 为 并 发 执行 ,其 中 图 9-12(c) 的 执行 结果 与 前 面 串 行 执行 
的 图 9-12(a) 相 同 , 即 A 王 9000,B 王 31000, 账 号 A 与 B 的 存款 总 和 仍 为 40000, 因 此 这 种 执 
行 称 可 串 行 化 的 并 发 执行 。 而 图 9-12(d) 也 是 并 发 执行 ,但 是 其 执行 结果 为 : 账号 A 与 了 
的 存款 总 和 为 10000 十 22000 王 32000, 因 此 一 致 性 产生 了 错误 ,由 此 可 见 事务 的 并 发 执行 ， 
如 果 不 加 控制 会 产生 执行 的 错误 。 
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时 间 步 T 到 
0 Read(A) 
A=A—10000 
Write(A) 
Read(B) 
B=B+10000 
Write(B) 
© Read(A) 
Temp 一 A*0.1 
A=A—Temp 
Write(A) 
Read(B) 
B=B+Temp 
Write(B) 
(a) 
时 间 步 T T: 
0 Read(A) 
Temp=A*0.1 
A=A—Temp 
Write(A) 
Read(B) 
B=B+Temp 
Write(B) 
© Read(A) 
A=A—10000 
Write(A) 
Read(B) 
B=B+10000 
WriteCB) 
(b) 
时 间 步 T T: 
0 Read(A) 
A=A—10000 
© Write(A) 
Read(A) 
Temp=A*0.1 
A=A—Temp 
Write(A) 
@ Read(B) 
B=B+10000 
Write(B) 
Q@ Read(B) 
B=B+Temp 
Write(B) 
(0 


9-12 并 发 事务 的 不 同调 度 


时 间 步 T T: 


0 Read(A) 
A 一 A 一 10000 
© Read(A) 
Temp=A*0.1 
A=A—Temp 
Write(A) 
Read( B) 
@ Write(A) 
Read(B) 
B=B+10000 
Write(B) 
@ B=B+Temp 
Write(B) 
(Cd) 
图 9-12 ( 续 ) 


9.5 两 段 锁 协议 


为 了 保证 并 发 调度 的 正确 性 ,数据 库 管理 系统 的 并 发 控制 保证 调度 是 可 串 行 化 的 。 目 
前 数据 库 管 理 系 统 普遍 采用 两 段 锁 (Two Phase Locking,2PL) 协 议 的 方法 实现 并 发 调度 的 
可 串 行 性 ,从 而 保证 调度 的 正确 性 。 
所 谓 两 段 锁 协议 是 指 所 有 事务 必须 分 两 个 阶段 对 数据 项 加 锁 和 解锁 。 在 对 任何 数据 进 
行 读 、 写 操作 之 前 ,首先 要 申请 并 获得 对 该 数据 的 封锁 ; 在 释放 一 个 封锁 之 后 ,事务 不 再 申 
请 和 获得 任何 其 他 封锁 。 
第 一 阶段 是 获得 封锁 ,也 称 为 扩展 阶段 ,在 这 个 阶段 ,事务 可 以 申请 获得 任何 数据 项 上 
的 任何 类 型 的 锁 , 但 是 不 能 释放 任何 锁 。 
第 二 阶段 是 释放 封锁 ,也 称 为 收缩 阶段 ,在 这 个 阶段 ,事务 可 以 释放 任何 数据 项 上 的 任 
何 类 型 的 锁 , 但 是 不 能 再 申请 任何 锁 。 
例如 ,事务 1 遵守 两 段 锁 协 议 , 其 封锁 序列 是 : 
Slock A…Slock B: Xlock C… Unlock B: Unlock A… Unlock C 
| 一 扩展 阶段 地 | | 二 收缩 阶段 | 
事务 2 不 遵守 两 段 锁 协议 ,其 封锁 序列 是 : 
Slock A… Unlock A… Slock BXlock C…Unlock C Unlock B 
可 以 证 明 ,车 并 发 执行 的 所 有 事务 均 遵守 两 段 锁 协 议 , 则 对 这 些 事务 的 任何 并 发 调度 策 
略 都 是 可 串 行 化 的 。 因 此 我 们 得 出 如 下 结论 : 所 有 遵守 两 段 封锁 协议 的 事务 ,其 并 行 的 结 
果 一 定 是 正确 的 。 
如 图 9-13 所 示 的 调度 是 遵守 两 段 锁 协 议 的 ,因此 一 定 是 可 串 行 化 调度 。 可 以 验证 如 
下 : 忽略 图 中 的 加 锁 操 作 和 解锁 操作 ,按时 间 的 先后 次 序 得 到 了 如 下 调度 : 
Si=Ri(A)R;(C)Wi(A)W,(C) Ri1(B)W(B)R;(A)W,(A) 
通过 交换 两 个 不 冲突 操作 的 次 序 , 先 交换 Rs(C) 与 Wi(A) ,得 到 : 


并 发 控 市 
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S,=R1(A)Wi(A)R,(C)W,(C) Ri(B)WI(B)R,(A)W,(A) 
再 把 Ri(B)Wi1(B) 与 Ra(C)W。(C) 交 换 , 可 得 到 : 
Ss=Ri(A) Wi (A)R1(B)W(B)R,(C)W,(C)R,(A)W,(A) 
因此 Ss 是 一 个 可 串 行 化 调度 。 


事务 Ti 事务 T 
Slock A 
R(A)=260 
Slock C 
R(C)=300 
Xlock A 
W(A)=160 
Xlock C 
W(C)=250 
Slock A 
Slock B 等 待 
R(B)=1000 等 待 
Xlock B 等 待 
W(B)=1100 等 待 
Unlcok A 等 待 
R(A)=160 
Xlock A 
Unlcok B 
W(A)=210 
Unlcok C 


图 9-13 ”遵守 两 段 锁 协 议 的 可 串 行 化 调度 


需要 特别 说 明 的 是 : 事务 遵守 两 段 锁 协 议 是 可 串 行 化 调度 的 充分 条 件 ,而 不 是 必要 条 
件 。 也 就 是 说 , 若 并 发 事务 都 遵守 两 段 锁 协议 , 则 对 这 些 事务 的 任何 并 发 调度 策略 都 是 可 串 
行 化 的 ; 但 是 , 若 并 发 事务 的 一 个 调度 是 可 串 行 化 的 ,不 一 定 所 有 事务 都 符合 两 段 锁 协议 。 

另外 ,还 需要 注意 两 段 锁 协 议和 防止 死 锁 的 一 次 封锁 法 的 异同 之 处 。 

名 一 次 封锁 法 要 求 每 个 事务 必须 一 次 将 所 有 要 使 用 的 数据 全 部 加 锁 , 否 则 就 不 能 继续 
执行 。 因 此 一 次 封锁 法 遵守 两 段 锁 协议 。 

@ 但 是 两 段 锁 协议 并 不 要 求 事务 必须 一 次 将 所 有 要 使 用 的 数据 全 部 加 锁 ,因此 遵守 两 
段 锁 协议 的 事务 可 能 发 生死 锁 , 如 图 9-14 所 示 。 


T T; 
Slock(B) 
R(B)=2 
Slock(A) 
R(A)=3 
Xlock (A) 
等 待 Xlock (A) 
等 待 等 待 
等 待 


9-14 ”遵守 两 段 锁 协 议 的 事务 发 生死 锁 


9.6 封锁 的 粒度 


X 锁 和 S 锁 都 是 加 在 某 一 个 数据 对 象 上 的 。 封 锁 的 对 象 可 以 是 逻辑 单元 ,也 可 以 是 物 
理 单元 。 例 如 ,在 数据 库 中 ,封锁 对 象 可 以 是 这 样 一些 逻 辑 单元 属性 值 .属性 值 的 集合 、 元 
组 .关系 .索引 项 .整个 索引 直至 整个 数据 库 ;， 也 可 以 是 这 样 一 些 物理 单元 : 页 (数据 页 或 索 
引 页 )、 块 等 。 封 锁 对 象 可 以 很 大 ,例如 对 整个 数据 库 加 锁 ; 也 可 以 很 小 ,例如 只 对 某 个 属性 
值 加 锁 。 封 锁 对 象 的 大 小 称 为 封锁 的 粒度 (Granularity) 。 

封锁 粒度 与 系统 的 并 发 度 控制 的 开销 密切 相关 。 封 锁 的 粒度 越 大 ,系统 中 能 够 被 封锁 
的 对 象 越 少 ,并 发 度 也 就 越 小 ,但 同时 系统 开销 也 就 越 小 。 反 之 ,封锁 的 粒度 越 小 ,并 发 度 较 
高 ,但 系统 开销 也 就 越 大 。 因 此 ,在 一 个 系统 中 同时 存在 不 同 大 小 的 封锁 单元 供 不 同 的 事务 
选择 使 用 是 比较 理想 的 。 

选择 封锁 粒度 时 必须 同时 考虑 封锁 开销 和 并 发 度 两 个 因素 ,对 系统 开销 与 并 发 度 进 行 
权衡 ,以 求 得 最 佳 的 效果 。 一 般 来 说 ,需要 处 理 大 量 元 组 的 用 户 事 务 可 以 以 关系 为 封锁 单 
元 ,而 对 于 一 个 处 理 少 量 元 组 的 用 户 事务 ,可 以 以 元 组 为 封锁 单元 以 提高 并 发 度 。 

多 粒度 封锁 如 果 在 一 个 系统 中 同时 支持 多 种 封锁 粒度 供 不 同 的 事务 选择 ,这 种 封锁 方 
法 称 为 多 粒度 封锁 (Multiple Granularity Locking)。 显 然 需要 这 种 支持 多 种 并 发 控制 粒度 
的 并 发 控制 协议 。 

具体 的 实现 方法 不 作 深入 讨论 。 读 者 有 需要 了 解 更 多 详情 可 以 参考 相关 书籍 。 


9.7 小 结 


数据 库 的 重要 特征 是 数据 的 共享 性 ,因此 就 可 能 有 多 个 事务 同时 对 相同 数据 对 象 进行 
操作 , 即 事务 的 并 发 操作 。 事 务 并 发 操作 会 带 来 丢失 修改 、 读 “ 脏 ” 数 据 和 不 可 重复 读 等 破坏 
数据 库 一 致 性 的 问题 。 数 据 库 管 理 系统 必须 提供 并 发 控制 机 制 来 协调 并 发 用 户 的 并 发 操作 
以 保证 并 发 事务 的 隔离 性 ,保证 数据 库 的 一 致 性 。 

事务 不 仅 是 数据 库 恢 复 的 基本 单位 ,也 是 并 发 控制 的 基本 单位 ,一 般 采 用 封锁 技术 来 实 
现 并 发 控制 。 本 章 介 绍 了 最 常用 的 封锁 方法 和 三 级 封锁 协议 。 不 同 的 封锁 和 不 同 级 别 的 封 
锁 协 议 所 提供 的 系统 一 致 性 保证 是 不 同 的 。 对 数据 对 象 施加 封锁 会 带 来 活 锁 和 死 锁 的 问 
题 , 数 据 库 一般 采 用 先 来 先 服务 、 死 锁 诊断 和 解除 等 技术 来 预防 和 解除 活 锁 与 死 锁 的 发 生 。 

并 发 控制 机 制 调度 并 发 事务 操作 是 否 正确 的 判别 准则 是 可 串 行 性 ,两 段 锁 协 议 是 可 串 行 
化 调度 的 充分 条 件 ,但 不 是 必要 条 件 。 因 此 ,两 段 锁 协 议 可 以 保证 并 发 事务 调度 的 正确 性 。 

不 同 的 数据 库 管理 系统 提供 的 封锁 类 型 .封锁 协议 达到 的 系统 一 致 性 级 别 不 尽 相 同 ， 
但 是 其 依据 的 基本 原理 和 技术 是 共同 的 。 


习 题 


1. 并 发 操作 可 能 会 产生 哪儿 类 数据 不 一 致 ? 采用 什么 方法 能 避免 各 种 不 一 致 的 情况 ? 
2. 在 数据 库 中 为 什么 要 并 发 控制 ? 并 发 控制 技术 能 保证 事务 的 哪些 特性 ? 


地 吧 颈 
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. 什么 是 封锁 ? 基本 的 封锁 类 型 有 几 种 ? 试 述 它们 的 含义 ? 
. 如 何 用 封锁 机 制 保证 数据 的 一 致 性 ? 
. 什么 是 活 锁 ? 试 述 活 锁 的 产生 原因 和 解决 方法 。 
. 什么 是 死 锁 ? 请 给 出 预防 死 锁 的 若干 方法 。 
. 请 给 出 检测 死 锁 发 生 的 各 种 方法 , 当 发 生死 锁 后 如 何 解除 死 锁 ? 
. 三 级 封锁 协议 指 什么 ?什么 是 封锁 的 粒度 ? 
. 试 解释 术语 “* 串 行 调度 "与 “可 串 行 化 调度 的 区 别 。 如 何 理解 调度 的 可 串 行 化 对 事 
务 调度 的 影响 。 
10. 什么 样 的 并 发 调度 是 正确 的 调度 ? 
11. 设 Ti 、T: 、T: 是 如 下 的 三 个 事务 , 设 A 的 初 值 为 0。 
Ti: A = A+2; 
T::A= Ax*2; 
Ts: A= Axx2( 即 A<—A’) 
(1) 若 这 三 个 事务 允许 并 发 执行 , 则 有 多 少 种 可 能 的 正确 结果 ? 请 一 一 列举 出 来 。 
(2) 请 给 出 一 个 可 串 行 化 的 调度 ,并 给 出 执行 结果 。 
(3) 请 给 出 一 个 非 串 行 化 的 调度 ,并 给 出 执行 结果 。 
(4) 若 这 三 个 事务 都 遵守 两 段 锁 协 议 ,请 给 出 一 个 不 产生 死 锁 的 可 串 行 化 调度 。 
(5) 若 这 三 个 事务 都 遵守 两 段 锁 协议 ,请 给 出 一 个 产生 死 锁 的 调度 。 
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第 10 章 数据 库 设 计 实 例 


【本 章 主 要 内 容 】 
1. 简单 介绍 SQL Server 的 发 展 历 程 及 SQL Server 2014 的 安装 方法 。 
2. 具体 介绍 一 个 数据 库 设计 实例 一 学 生 选 课 管 理 系统 。 


通过 之 前 各 章 的 介绍 ,已 经 大 致 了 解 了 数据 库 的 设计 过 程 , 为 了 更 好 地 理解 和 掌握 数据 
库 设 计 的 理论 知识 ,需要 对 一 些 数据 库 设 计 的 实例 进行 分 析 和 研究 。 

需要 说 明 的 是 : 为 了 讨论 方便 ,本 音 所 列举 的 数据 库 设计 实例 都 做 了 一 定 程度 的 简化 ， 
而 实际 应 用 中 往往 要 复杂 得 多 ,因为 要 考虑 具体 的 用 户 需求 .实施 环境 等 细节 。 所 以 ,在 实 
际 应 用 中 ,要 根据 具体 情况 进行 设计 和 实施 ,而 不 能 盲目 照搬 。 

本 章 的 实例 后 台数 据 库 设 计 采 用 SQL Server 2014, 前 台 开 发 采用 Visual Studio. 
NET 2015。 


10.1 SQL Server 简介 


10.1.1 SQL Server 的 发 展 历程 


SQL Server 是 Microsoft 公司 的 一 个 关系 数据 库 管 理 系统 ,一 经 推出 便 得 到 了 广大 用 
户 的 积极 响应 并 迅速 成 为 数据 库 市 场 上 的 重要 产品 。SQL Server 最 早起 源 于 1987 年 的 
SybaseSQL Server, 最 初 是 由 Microsoft、Sybase 和 Aston-Tate 三 家 公司 共同 开发 的 。1988 
年 ,Microsoft 公司 ,Sybase 公司 和 Aston-Tate 公司 把 该 产品 移植 到 OS/2 上 。 后 来 Aston- 
Tate 公司 退出 了 该 产品 的 研发 ,而 Microsoft 公司 .Sybase 公司 签署 了 一 项 共同 开发 协议 ,其 结 
果 是 发 布 了 用 于 Windows NT 操作 系统 的 SQL Server。 并 于 1992 年 ,将 SQL Server 移植 到 了 
Windows NT 平台 上 。 下 面 简单 列 出 了 SQL Server 发 展 历程 的 儿 个 重要 阶段 。 
1988 年 : SQL Server 问世 ,由 Microsoft、Sybase 和 Aston-Tate 三 家 公司 共同 开发 ， 
运行 于 OS/2 平台 。 
1993 年 : SQL Server 4. 2 发 布 , 它 是 一 种 功能 较 少 的 桌面 数据 库 管 理 系统 。 
1994 年 : Microsoft 与 Sybase 在 数据 库 开 发 方面 的 合作 中 止 。 
1995 年 : SQL Server 6. 05 发 布 , 该 版 本 重 写 了 核心 数据 库 系统 , 它 是 一 种 小 型 商业 
数据 库 管 理 系 统 。 
1996 年 : SQL Server 6. 5 发 布 .SQL Server 逐渐 突显 实力 ,以 至 于 Oracle 推出 了 运 
行 于 NT 平台 上 的 7. 1 版 本 作为 直接 竞争 。 
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1998 年 : SQL Server 7.0 发 布 ,这 是 一 种 Web 数据 库 ,对 核心 数据 库 引擎 进行 了 重 
大 改写 ,提供 中 小 型 商业 应 用 数据 库 方案 。 

2000 年 : SQL Server 2000 发 布 , 该 版 本 继承 了 SQL Server 7. 0 的 优点 ,同时 增加 
了 许多 更 先进 的 功能 ,具有 使 用 方便 、 可 伸缩 性 好 、 与 相关 软件 集成 程度 高 等 优点 。 
2005 年 : SQL Server 2005 发 布 , 引 入 了 . NET Framework, 允许 构建 . NET SQL 
Server 专 有 对 象 ,使 SQL Server 具有 更 加 灵活 的 功能 。 

2008 年 : SQL Server 2008 发 布 , 在 SQL Server 2005 的 基础 上 增加 和 增强 了 许多 
新 的 特性 和 功能 ,可 为 关键 业务 应 用 提供 可 信赖 的 、 高 效 的 ,智能 的 平台 ,支持 基于 
策略 的 管理 .审核 、 大 规模 数据 仓库 、 空 间 数据 、 高 级 报告 与 分 析 服 务 等 新 特性 。 
2012 年 : SQL Server 2012 发 布 ,提供 了 更 多 、 更 全 面 的 功能 以 满足 不 同人 群 对 数据 
以 及 信息 的 需求 。 包 括 支 持 来 自 不 同 网 络 环境 的 数据 的 交互 、 全 面 的 自助 分 析 等 创 
新 功能 。 

2014 年 : 2014 年 4 月 16 日 于 旧金山 召开 的 一 场 发 布 会 上 ,Microsoft 公司 正式 推出 
SQL Server 2014 。 


10.1.2 SQL Server 2014 版 本 新 功能 


在 SQL Server 2014 中 已 经 增加 了 对 物理 I/O 资源 的 控制 ,这 个 功能 在 私有 云 的 数据 
库 服务 器 上 的 作用 体现 得 尤为 重要 , 它 能 够 为 私有 云 用 户 提供 有 效 的 控制 .分配 , 并 隔离 物 
理 1/O 资源 。 以 下 详细 介绍 SQL Server 2014 的 新 特性 。 

内 置 内 存 技术 : 集成 内 存 OLTP 技术 ,针对 数据 仓库 而 改善 内 存 列 存 储 技术 ; 通过 
Power Pivot 实现 内 存 BI 等 。 美国 一 家 博彩 企业 ,通过 内 置 存储 技术 ,将 每 秒 请 求 量 从 
15000 增加 到 250000 ,不 仅 大 幅 改善 了 用 户 体验 ,而 且 还 获得 了 压倒 对 手 的 劳 争 力 。 

安全 方面 : 连续 5 年 漏洞 最 少 的 数据 库 ,市 场 占 有 率 是 46% ,全 球 使 用 率 极 高 。 

扩展 性 方面 : 计算 扩展 ,高 达 640 颗 逻 辑 处 理 器 ,每 个 虚拟 机 64 颗 vCPU ,每 虚拟 机 
1TB 内 存 ,每 集群 64 个 节点 。 网 络 扩展 ,网 络 虚拟 化 技术 提升 了 灵活 性 与 隔离 性 ,分 配 最 
小 和 最 大 带宽 ,以 及 存储 扩展 都 有 很 大 提升 。 

BI: 企业 可 以 通过 熟悉 的 工具 ,如 Office 中 的 Excel 以 及 Office 365 中 的 Power BI, 加 
速 分 析 以 快速 获取 突破 性 的 洞察 力 ,并 提供 基于 移动 设备 的 访问 。 

混合 云 方面 : 跨越 客户 端 和 云端 ,Microsoft SQL Server 2014 为 企业 提供 了 云 备份 以 
及 云 灾难 恢复 等 混合 云 应 用 场景 ,无 缝 迁移 关键 数据 至 Microsoft Azure。 企 业 可 以 通过 一 
套 熟 悉 的 工具 ,跨越 整个 应 用 的 生命 周期 ,扩建 .部 署 并 管理 混合 云 解 决 方案 ,实现 企业 内 部 
系统 与 云端 的 自由 切换 。 

与 闪存 卡 搭配 : 与 LSI Nytro 闪存 卡 相 结合 使 用 , 则 可 满足 云 中 最 苛刻 工作 负载 对 性 
能 的 要 求 ,消除 企业 IO 瓶颈 ,加 速 交易 ,充分 挖掘 数据 价值 ,使 客户 受益 。 


10.2 SQL Server 2014 的 安装 


本 章 的 实例 均 采用 SQL Server 2014 数据 库 管 理 系统 ,以 下 简单 介绍 SQL Server 2014 
的 安装 过 程 。 


目前 官方 提供 的 安装 程序 版 本 包括 Enterprise Edition、Express、Express with 
Advanced Services、Express with Tools、LocaldB、Management Studio 几 种 类 型 ,针对 的 操 
作 系 统 有 32 位 和 64 位 。 这 里 介绍 Enterprise Edition 中 文 版 的 安装 方法 。 


10.2.1 SQL Server 2014 安装 系统 需求 


1. 硬件 环境 

(1) 内 存 处 理 器 要 求 

以 下 内 存 和 处 理 器 要 求 适用 于 所 有 版 本 的 SQL Server 2014。 

内 存 最 低 要 求 : Express 版 本 ,512MB; 所 有 其 他 版 本 ,1GB。 建 议 Express 版 本 ,1GB; 
所 有 其 他 版 本 ,至少 4GB, 并 且 应 该 随 着 数据 库 大 小 的 增加 而 增加 ,以 便 确 保 最 佳 的 性 能 。 

处 理 器 速度 最 低 要 求 : x86 处 理 器 ,1. 0GHz; x64 处 理 器 ,1. 4GHz。 建 议 2. 0GHz 或 
更 快 。 

处 理 器 类 型 包括 x64 处 理 器 : AMD Opteron、AMD Athlon 64、 支 持 Intel EM64T 的 
Intel Xeon, 支 持 EM64T 的 Intel Pentium 4。 

x86 处 理 器 : Pentium 思 兼 容 处 理 器 或 更 快 。 

(2) 硬盘 空间 要 求 (32 位 和 64 位 ) 

在 安装 Windows Installer 创建 临时 文件 系统 驱动 器 上 ,用 户 若 想 运行 安装 程序 以 安装 
或 升级 SQL Server, 请 确保 有 至 少 6.0GB 的 这 些 文件 系统 驱动 器 上 的 可 用 磁盘 空间 。 此 要 
求 满足 即使 组 件 安装 到 非 默 认 驱 动 器 也 可 运行 通过 。 

实际 硬盘 空间 需求 取决 于 系统 配置 和 决定 安装 的 功能 。 

2. 软件 要 求 

(1) 网 络 软件 : SQL Server 2014 支持 的 操作 系统 具有 内 置 网 络 软件 。 独 立 安 装 的 命 
名 实例 和 默认 实例 支持 以 下 网 络 协议 : 共享 内 存 、 命 名 管道 .TCP/IP 和 VIA。 

(2) 框架 : 在 选择 SQL Server 2014、 数 据 库 引 擎 、Reporting Services、 Master Data 
Services、 复 制 或 Data Quality Services 时 ,. NET 3. 5 SP1 是 SQL Server Management 
Studio 所 必需 的 ,但 不 再 由 SQL Server 安装 程序 安装 。 

如 果 你 运行 安装 程序 并 没有 . NET 3. 5 SP1, SQL Server 安装 程序 要 求 下 载 并 安装 
.NET 3.5 SP1, 然 后 才能 继续 使 用 SQL Server 安装 。 

Internet: 使 用 Internet 功能 需要 连接 Internet。 

10.2.2 SQL Server 2014 安装 步骤 人 


县 2052 CHSs_IP 


(1) 首先 下 载 SQL Server 2014 的 安装 包 , 双 击 setup. exe 文 一 


国 resources 
件 , 如 图 10-1 所 示 。 As 
(2) 启动 安装 程序 setup. exe 后 进入 SQL Server 安装 中 心 ， 有 x64 
选择 “全 新 SQL Server 独立 安装 或 向 现 有 安装 添加 功能 ”如 。 下 Metan 

图 10-2 所 示 。 - 


DD setup.exe.config 


(3) 选择 全 新 安装 之 后 进入 “安装 程序 支持 规则 ”界面 ,安装 smtpeeral 


图 sqamapidll 


程序 将 自动 检测 安装 环境 的 基本 支持 情况 。 完 成 检测 后 , 单 击 “ 确 
定 ” 按 钮 ,进入 后 续 安装 界面 。 图 10-1 安装 开始 界面 


数据 库 设 计 突 鲍 


数据 库 原 理 及 应 用 教程 一 -SQL Server 2014 


了 全 新 SQL Server 独立 安装 或 向 现 有 安装 添加 功能 
启动 向 导 ， 在 非 寿 集 环境 中 安装 SQL Server 2014 或 向 现 有 SQL Server 2014 实例 中 
添加 功能 . 


< 新 的 SQL Server 故障 转移 群集 安装 
启动 向 导 , 安装 单 节点 的 SQL Server 2014 故障 转移 群集 。 


填 向 SQL Server 故障 转移 群集 添加 证 点 
启动 向 导 , 向 现 有 SQL Server 2014 故障 转移 群集 中 添加 节点 


EE 


从 SQL Server 2005、SQL Server 2008、SQL Server 2008 R2 或 SQL Server 2012 
升级 

启动 一 个 向 导 , 将 SQL Server 2005、SQL Server 2008、SQL Server 2008 R2 或 
SQL Server 2012 升级 到 SQL Server 2014. 


图 10-2 进入 SQL Server 安装 中 心 界面 


(4) 在 “产品 密 钥 ”界面 选择 相应 的 安装 版 本 并 输入 产品 密 钥 后 , 单 击 “ 下 一 步 " 按 钮 , 进 
入 “许可 条 款 ” 界 面 ,如 图 10-3 所 示 。 
着 SQLseverz0l4sssEF 本 E [一 > 一 | 
产品 密 钥 


指定 要 安装 的 SQL Server 2014 版 本 . 


产品 密 角 请 通过 输入 Microsoft 真品 证 书 或 产品 包装 上 的 由 25 个 字符 钥 成 的 密 铀 来 验证 此 SQL Server 2014 实 
许可 条 款 例 。 您 也 可 以 指定 SQL Server 的 免费 版 本 ， 例 如 Evaluation 或 Express。 如 SQL Server 联机 从 书 中 所 
述 , Evaluation 具有 SQL Server 的 全 部 功能 , 目 已 激活 ， 有 180 天 试用 期。 要 从 一 个 版 本 升级 到 另 一 版 
全 局 规则 本 ,请 运行 版 本 升级 向 导 , 


日 指定 可 用 版 本 (S): 
Evaluation 3 


加 输入 产品 密 钥 (日 : 
27HM]-GH7P9-X2TTB-WPHOC -RG79R 


< 上 冰晶 | Fw)| em 


图 10-3 “产品 密 钥 ”界面 


(5) 阅读 许可 条 款 , 勾 选 “ 我 接受 许可 条 款 ” 后 单 击 “ 下 一 步 ” 按 钮 ,进入 “安装 程序 检测 
规则 ”界面 ,如 图 10-4 所 示 。 


Microsoft 放 件 许可 委 吉 。 
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将 可 和 入 
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ps 团 我 接受 许可 条 车 - 
ek 加 记 用 审 户 估 聊 基 计 划 (“CElP”) 和 模 训 报告, 以 了 二 改进 Microsoft SQL Server 2014 的 世 量 .可 
安装 进攻 徘 性 和 位 能 (DD. 
下 
有 关 详细 信息 ,请 参 网 Microsoft SQL Server 2014 隐私 丙 硼 、 
onoh SQL ener 20 和 各 人 一人 Vouel sd 全体 该 和 人 /全 RH 用 CE 训 , 如 
MR Ve Da CE Ve 


En 
10-4 “许可 条 款 ” 界 面 


(6) 在 这 一 步 , 安 装 程序 将 自动 检测 全 局 规则 是 否 通 过 ,如 有 失败 项 , 需 根据 相应 提示 
更 正 失败 ,全 部 通过 则 单 击 * 下 一 步 ” 按 钮 ,如 图 10-5 所 示 。 


SQL Server 2014 
产品 地 相 pr 已 地 二 9. 失 让 0. 敬告 0. 已 问 寺 0. 
许可 各 软 
全 局 规则 
Microsoft Update 
产品 更 新 
安 壬 安 半 层 序 文件 
安 半 禹 则 规则 3 
设 于 角色 EE 过 
0 至 |@ la E33 
功能 规则 | 回 | Beat E 过 
功能 配置 规则 |@ | windows Management Instrumentation [WMD 服务 已 到 过 
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安 壬 进度 | 峡 |5QL Server 安 委 介 下 上 文件 和 9 长 源 科 名称 [3 
完成 | 加 | SQt server s 兰 是 产品 不 妆容 还 过 
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图 10-5 “安装 程序 全 局 规则 "界面 党 
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发 据 亩 原理 及 应 用 栽 程 一 -SQL Server 2014 


(7) 设置 Microsoft 更 新 ,可 视 个 人 喜好 是 否 勾 选 自动 检查 更 新 ,设置 完 后 单 击 下 一 步 ， 


如 图 10-6 所 示 。 


Microsoft Update 为 Windows 以 及 包括 SQL Server 2014 在 内 的 其 他 Microsof 软件 提供 安全 性 
和 其 他 重要 更 新 。 可 使 用 自动 更 新 传送 更 新 ,也 可 访问 Microsoft Update 网 站 . 


四 使 用 Microsoft Update 检查 更 新 推荐 )(M) 


Microsoft Update 呈 骨 问 本 
Microsoft Update 访 私 声明 


图 10-6 设置 更 新 界面 


(8) 在 这 一 步 ,安装 程序 将 自动 检测 安装 规则 ,同上 ,如 有 失败 项 , 需 根据 相应 提示 更 正 
失败 ,全 部 通过 则 单 击 “ 下 一 步 ”按钮 ,直接 进入 下 一 步骤 ,如 图 10-7 所 示 。 
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损 作 计 成 。 已 通过 7。 失效 0. 警告 0。 已 药 过 0. 
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图 10-7 “安装 规则 ”界面 


(9) 设置 角色 ,选择 默认 勾 选 的 "SQL Server 功能 安装 ”选项 即 可 , 单 击 “ 下 一 步 "按钮 ， 
进入 配置 路 径 界 面 ,如 图 10-8 所 示 。 


年 SQL Sever 2014 | 
| 
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全 局 规则 和 ER 功能. 
Microsoft Update © SQL Server PowerPivot for SharePoint(P) 
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i 惨 访 问 .或 者 ,未 加 SQL Server 关系 数 生 霹 引 | 和 以 全 用 作 新 二 的 数 二 志和 务 器. 
安装 规则 将 SQL 5erver 数 县 库 关 系 引 畦 到 务 未 加 到 此 二 丢 [- 
设 村 角色 具有 财 认 全 的 扩 有 功能 (D) 
WE 使 用 服务 林 户 的 时 认 便 安 壬 所 有 功能 - 
功能 坑 则 
功能 配置 规则 
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安装 进度 
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图 10-8 “设置 角色 ”界面 


(10) 在 “配置 路 径 ” 中 需要 选择 安装 哪些 SQL Server 功能 并 配置 相应 路 径 , 单 击 全 选 
后 在 下 方 分 别 配置 实例 和 共享 功能 的 目录 ,操作 完毕 后 单 击 “ 下 一 步 ” 按 钮 ,进入 “功能 选择 ” 
界面 ,如 图 10-9 所 示 。 


图 10-9 “功能 选择 ”界面 
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履 据 亩 原理 及 应 用 栽 程 一 -SQL Server 2014 


(11) 此 时 安装 程序 将 自动 检测 功能 规则 ,如 有 失败 项 , 需 根据 相应 提示 更 正 失败 ,全 部 
通过 则 单 击 “ 下 一 步 ” 按 钮 ,直接 进入 “功能 规则 ”界面 ,如 图 10-10 所 示 。 
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功 有 眩光 择 加 SQL Server Analysis Services 服务 器 模式 和 版 本 检查 Ba 
功能 规则 @ 需要 Microsoft ,NET Framework 3.5 Service Pack 1 [9 
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图 10-10 “功能 规则 ”界面 


(12) 指定 实例 ID, 这 个 ID 会 决定 安装 路 径 里 实例 的 文件 名 ,默认 是 MS 
SQLSERVER ,这 里 保持 默认 的 配置 就 好 了 ,下 方 会 显示 涉及 的 各 文件 的 目录 , 单 击 “ 下 一 
步 " 按 钮 ,进入 “实例 配置 "界面 ,如 图 10-11 所 示 。 
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SQL server BR DAProgram Files\Microsoft SQL Server\MSSQL12.MSSQLSERVER 
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图 10-11 “实例 配置 "界面 


(13) 在 完成 安装 内 容 选择 之 后 会 显示 磁盘 使 用 情况 ,用 户 可 根据 磁盘 空间 自行 调整 ， 
单 击 “ 下 一 步 "按钮 ,进入 “服务 器 配置 "界面 。 这 里 可 以 设置 用 于 使 用 每 个 SQL Server 服务 
的 账户 的 密码 ,按照 默认 配置 即 可 ,如 图 10-12 所 示 。 


图 10-12 “服务 器 配置 界面 


(14) 服务 器 配置 完成 后 , 单 击 * 下 一 步 " 按 钮 ,进入 “数据 库 引 擎 配置 ?界面 。 该 配置 将 
影响 以 后 使 用 数据 库 管 理工 具 时 的 登录 方式 。 身 份 验证 模式 ,默认 勾 选项 是 "Windows 身 
份 验证 模式 ”, 即 只 需 通 过 Windows 管理 员 账 户 验 证 即 可 登录 ,一 般 会 勾 选 第 二 项 ,“ 混 合 模 
式 (SQL Server 身份 验证 和 Windows 身份 验证 )”, 勾 选 后 需 设置 系统 管理 员 账 户 的 密码 ; 指定 
SQL Server 管理 员 , 单 击 “ 添 加 当前 用 户 ”, 操 作 完成 后 单 击 “ 下 一 步 "按钮 ,如 图 10-13 所 示 。 


日 Windows 身份 验证 模式 (W) 
二 肖 台 模式 (SQL Server 身份 验证 和 Windows 身份 窒 瑟 (M) 


地 己 


图 10-13 “数据 库 引擎 配置 "界面 
数据 亩 设计 实例 


发 据 亩 原理 及 应 用 栽 程 一 -SQL Server 2014 


(15) 进入 服务 器 模式 ,采用 默认 选项 “多 维和 数据 挖掘 模式 ”, 同 上 , 单 击 “添加 当前 用 
户 ” 设 置 对 Analysis Services 的 管理 权限 ,完成 后 单 击 * 下 一 步 "按钮 ,如 图 10-14 所 示 。 
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10-14 “Analysis Services 配置 ?界面 


(16) 如 果 要 指定 Reporting Services 配置 模式 ,采用 默认 设置 即 可 ,当然 如 果 想 后 续 配 
置 可 选择 * 仅 安装 ”, 完 成 后 单 击 * 下 一 步 ?按钮 ,如 图 10-15 所 示 。 
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10-15 “Reporting Services 配置 ?界面 


(17) 如 果 要 指定 Distributed Replay 控制 器 的 访问 权限 ,同上 ,通过 单 击 “添加 当前 用 
户 ? 设 置 管理 员 权 限 ,完成 后 单 击 * 下 一 步 ?按钮 ,如 图 10-16 所 示 。 


二 sQt Server 2014 
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图 10-16 “Distributed Replay 配置 "界面 


(18) 该 步骤 设置 Distributed Replay 客户 端 指 定 的 相应 控制 器 和 数据 目录 ,在 控制 器 
名 称 处 输入 "localhost”, 目 录 采 用 默认 设置 ,完成 后 单 击 * 下 一 步 "按钮 ,如 图 10-17 所 示 。 
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图 10-17 “Distributed Replay 客户 端 配置 界面 


履 据 库 设 计 实 向 


履 据 亩 原理 及 应 用 栽 程 一 -SQL Server 2014 


(19) 在 这 一 步 安装 程序 将 自动 检测 功能 配置 规则 ,全 部 通过 则 直接 进入 下 一 步骤 ,如 
10-18 所 示 。 
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图 10-18 “功能 配置 规则 ”界面 


(20) 这 是 安装 前 最 后 一 步 ,验证 将 要 安装 的 SQL Server 功能 ,在 最 下 方 显示 了 配置 文 
件 的 路 径 ,全 部 验证 完毕 后 单 击 * 安 装 ?按钮 ,如 图 10-19 所 示 。 接 下 来 进入 程序 安装 需要 等 
待 一 段 时 间 , 进 入 “安装 进度 "界面 ,如 图 10-20 所 示 。 
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图 10-19 “准备 安装 ”界面 


图 10-20 “安装 进度 "界面 


(21) 安装 完成 后 会 提示 用 户 需要 重新 启动 计算 机 ,看 到 该 对 话 框 后 单 击 “ 确 定 ” 按 钮 ， 
则 出 现 安装 完成 的 界面 ,此 时 SQL Server 2014 就 安装 完毕 了 ,关闭 安装 程序 后 请 记得 重启 
计算 机 ,如 图 10-21 所 示 。 


E33 
成 功 
成 功 
eh 


查看 SQL Server 产品 文 多 < 


Re 文档 的 组 件 * 默认 情况 下 ， 帮 助 查看 器 组 件 使 用 联机 库 。 
Sener 后 ， 您 可 以 使 用 帮助 库 管理 器 组 件 将 文档 下 载 到 你 的 本 地 计算 机 。 有 关 详 细 信 
由 村 Microsof SQL Server 联机 丛书 (chttplgo_ microsof comviwink/?LinkiD= 


10-21 “完成 "界面 
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(22) 程序 安装 完成 , 单 击 “ 开 始 ” 图 标 。 找 到 SQL Server 2014 Management studio 单 
击 运行 ,如 图 10-22 所 示 。 


(23) 启动 数据 库 ,登录 数据 库 服务 器 , 单 击 " 连 接 ” 连 接 到 数据 库 服 务 器 ,如 图 10-23 
所 示 。 


a 连接 到 服务 器 x 
Microsoft SQL Server 2014 
服务 器 类 型 (T) 数据 库 引擎 ~ 
服务 器 名 称 (S) ~ 
身份 验证 (A): Windows 身份 验证 ~ 
用 户 名 WW JOE\Joe vy 
E24 
记 住 富 码 如) 
取消 “| 二 通 页 O) > 


图 10-22 “运行 "界面 图 10-23 ”数据库 连 接 对 话 框 


10.2.3 SQL Server 2014 的 配置 过 程 


SQL Server 2014 初始 采用 默认 配置 ,这 些 设置 就 能 保障 SQL Server 2014 的 正常 工 
作 , 但 是 为 了 充分 发 挥 其 性 能 ,用 户 可 以 对 其 进行 一 些 必要 的 配置 。 

用 户 可 以 右 击 “ 我 的 电脑 ”找到 “计算 机 管理 ”, 在 “服务 和 应 用 程序 ”中 找到 SQL Server 
配置 管理 器 , 单 击 打开 ,找到 “SQL server 服务 ”, 如 图 10-24 所 示 。 


二 i 计 各 We 理 
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> 基 村 SQL Server Analysis Services (M.。 正 在 运行 自动 NT Service\MSSQ- 
Cs 配 SQL Server Reporting Services (。 正 在 二 行 。 自动 NT Service\Repor.. 更 多 提 作 » 
十 设 向 芝 理 和 者 SQL Server Browser Bor 大 他 [引导 -NT AUTHORITWL- 
vm 鸭 saQt Server 代理 (MSSQLSERVER) 已 储 目 #9 NT Sevice\SQLSE.. 
交配 于 
~ 一 服务 和 应 用 性 序 
Ld 
曾 wMI 吾 件 
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>》 上 县 sat server 网 配置 

>》 最 SQL Native Cient 110 醒 于 


< | 


图 10-24 “SQL Server 2014 配置 管理 ”界面 


(1) 从 图 10-24 中 可 以 看 到 右 侧 已 经 列 出 当前 计算 机 上 的 所 有 SQL Server 服务 ,同时 
也 可 以 看 到 服务 的 状态 信息 ,包括 服务 的 运行 状态 .启动 模式 .登录 身份 .进程 ID 和 服务 
类 型 。 

(2) 如 果 和 希望 配置 服务 的 属性 ,可 以 选中 相应 的 服务 并 右 击 ,在 弹出 的 快捷 菜单 中 选择 
“属性 ”命令 ,如 图 10-25 所 示 。 

(3) 在 “登录 ”选项 卡 中 可 以 更 改 用 户 身 份 。 

如 果 选 中 “本 账户 ” 单 选 按钮 ,可 以 直接 输入 登录 的 账户 名 和 密码 ,也 可 以 单 击 “ 浏 览 ” 按 
钮 查找 系统 中 已 经 定义 的 用 户 账户 。 

如 果 选 中 “内 置 账户 ” 单 选 按钮 ,在 下 拉 列 表 框 中 可 以 选择 内 置 账 户 的 类 型 。 

(4)“ 服 务 ” 选 项 卡 , 其 中 列 出 了 相应 的 SQL 服务 类 型 .错误 控制 二进制 路 径 .进程 ID、 
服务 名 称 、 启 动 模式 、 退 出 代码 、 主 机 名 和 运行 状态 等 信息 。 除 了 启动 模式 其 他 属性 不 可 更 
改 , 若 要 改变 此 模式 可 以 单 击 “ 启 动 模式 ” 右 侧 的 下 拉 菜 单 来 选择 ,如 图 10-26 所 示 。 


SQL Server Integration Services 12.0 属性 ? x 


SQL Server Integration Services 12.0 属性 a x 
登录 服务 高 级 
登录 身份 为: 
口内 置 帐户 gg): 
“*C\Program Files\Microsoft SQL 
图 本 帐户 H): 7380 
帐户 名 N): rm WD Pr] 3 Server Integration Services 1 
密码 (A); eeeeeeeeee 0 
JOE 
确认 密码 (c); eeeeeeeseeeee 正在 运行 
服务 状态 : 正在 运行 
HE [tm | RR sy 
| 
| 


图 10-25 ”SQL Server 2014 服务 的 “登录 ”属性 设置 图 10-26 ”SQL Server 服务 的 “启动 模式 ”设置 


(5)“ 高 级 ”选项 卡 中 的 服务 是 一 些 高 级 属性 ,通常 情况 下 无 须 修改 。 
(6) 对 服务 器 中 的 属性 进行 更 改 后 ,可 以 单 击 * 应 用 ?或 “确定 ?按钮 。 若 更 改 了 服务 的 
登录 身份 则 需 重新 启动 服务 才能 生效 。 


10.3 学 生 选 课 管 理 系统 


10.3.1 系统 设计 背景 


当今 时 代 是 飞速 发 展 的 信息 时 代 , 在 各 行 各 业 中 离 不 开 信息 处 理 , 这 正 是 计算 机 被 广泛 
应 用 于 信息 管理 系统 应 用 环境 的 原因 。 采 用 计算 机 进行 信息 管理 ,不 仅 提高 了 工作 效率 ,而 
且 大 大 地 提高 了 其 安全 性 。 而 传统 的 手工 数据 处 理 方式 ,具有 工作 量 大 出错 率 高 .出 错 后 
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不 易 更 改 等 问题 。 

高 等 学 校 为 了 提高 教学 质量 ,教学 管理 方式 本 着 以 人 为 本 的 原则 ,管理 方式 越 来 越 科 
学 、 越 来 越 规范 。 学 籍 信息 管理 是 各 大 高 校 的 主要 日 常 管理 工作 之 一 ,涉及 整个 学 校 各 个 学 
院 、 各 个 专业 、 每 位 教师 以 及 每 位 学 生 的 诸多 方面 , 随 着 教学 体制 的 不 断 改 革 , 尤 其 是 学 分 
制 、 选 课 制 的 展开 和 深入 ,学 生成 绩 日 常 管理 及 保存 管理 工作 日 趋 繁重 、 复 杂 。 和 迫切 需要 研 
发 一 款 功 能 强大 操作 简单 .具有 人 性 化 的 学 籍 信 息 管理 系统 。 

本 系统 从 素质 教育 出 发 ,开设 多 种 门类 的 课程 供 学 生 选 择 , 学 生 的 学 籍 管 理 也 采取 弹性 
学 制 ,允许 学 生 在 完成 专业 方向 的 必修 课程 学 习 之 外 ,可 以 根据 自己 的 兴趣 爱好 选修 自己 感 
兴趣 的 课程 。 


10.3.2 需求 分 析 


学 籍 管理 系统 需要 解决 以 往 手 工 管理 的 种 种 整 端 ,因此 在 此 基础 上 ,系统 应 该 实现 以 下 
功能 : 管理 员 可 以 维护 学 生 ,老师 信息 ,包括 增加 新 同学 、 新 老师 ; 修改 已 在 校 教师 .学 生 的 
基本 信息 ; 办 理学 生 ,教师 登录 登记 ,删除 离 校 学 生 ,教师 信息 ,查询 在 线 人 员 等 。 而 对 于 学 
生 用 户 则 可 以 查询 个 人 信息 、 修 改 部 分 信息 等 。 具 体 要 求 如 下 。 

(1) 学 生 信息 管理 : 查询 .更 新 个 人 信息 ; 查询 已 完成 课程 成 绩 ; 查看 已 选课 的 课程 ， 
还 可 以 查看 选课 和 退 选课 程 信息 等 。 学 生 信息 包括 学 号 、 姓 名 、 性 别 、 专 业 、 院 系 、 年 龄 . 电 
话 、.QQ、E-mail 等 。 

(2) 教师 信息 管理 : 维护 个 人 信息 ,并 根据 实际 情况 查询 ; 更 新 个 人 信息 (如 电话 ， 
E-mail 等 ); 并 对 所 教授 的 学 生 进 行 成 绩 登 记 ; 查看 自己 的 教学 安排 ,包括 讲授 课程 ; 授课 
的 时 间 、 地 点 ; 以 往 所 教授 课程 的 学 生 的 成 绩 等 信息 。 教 师 信 息 包括 工 号 、 姓 名、 性 别 \ 年 
龄 . 院 系 、 职 称 、 电 话 、E-mail 等 。 

(3) 管理 员 管 理 : 包括 维护 学 生 、 教 师 以 及 课程 信息 ,并 对 学 生 、 教 师 账号 密码 进行 管 
理 等 。 

教学 管理 的 基本 规定 : 每 门 课 可 以 由 多 个 教师 开设 ,不 同 老师 开设 的 同名 课程 有 不 同 
的 代码 ; 每 个 教师 可 以 开设 多 门 课程 ; 每 个 学 生 可 以 选修 多 门 课程 ,每 门 课程 有 多 个 学 生 
选修 ,每 个 学 生 选 修 每 门 课程 都 会 获得 一 个 成 绩 。 

为 了 简便 起 见 , 本 案例 中 学 校 的 院 系 .专业 信息 固定 ,不 单独 教学 维护 管理 ,也 不 考虑 教 
师 排 课 的 时 间 冲 突 等 问题 ,假定 排 课 由 人 工 进行 合理 安排 。 

学 籍 信息 系统 主要 有 三 种 用 户 模式 。 

(1) 管理 员 : 可 以 设置 管理 员 ,学生 教师 信息 等 ,拥有 系统 的 最 高 权限 。 

(2) 教师 : 维护 个 人 的 基本 信息 ,对 所 教授 的 学 生 分 配 成 绩 。 

(3) 学 生 : 查询 个 人 的 基本 信息 ,选择 和 退 选课 程 。 由 于 教师 能 给 学 生 分 配 成 绩 ,一 旦 
教师 为 此 学 生 分 配 了 成 绩 , 此 学 生 的 该 门 课程 不 允许 退 选 。 


10.3.3 概要 结构 设计 


分 析 学 籍 信息 管理 系统 的 需求 ,将 现实 世界 中 教学 管理 中 涉及 的 人 、 物 . 事 进行 抽象 ,得 
到 系统 的 实体 、 实 体 属性 、 实 体 的 码 、 实 体 之 间 的 联系 以 及 联系 的 类 型 。 利 用 ER 图 来 表 
示 , 就 可 以 设计 出 学 籍 信息 管理 系统 的 概念 模型 。 结 合 题 意 的 具体 分 析 可 以 进一步 确定 实 


体 与 联系 的 属性 和 码 。 

通过 之 前 的 分 析 , 可 以 抽取 出 的 学 生 选 课 管理 系统 的 基本 实体 有 : 学 生 教师 .课程 这 3 
个 实体 。 这 3 个 实体 是 通过 教师 授课 .学 生 选 课 产生 联系 的 ,学 生 与 教师 .课程 三 者 之 间 是 
多 对 多 的 联系 。 

下 面 介 绍 概念 结构 设计 的 具体 步骤 。 

1. 抽象 出 该 系统 的 实体 

根据 分 析 , 学 生 选 课 管 理 系 统 主要 包含 学 生 、 教 师 、 课 程 3 个 实体 。 画 出 3 个 实体 的 局 
部 ER 图 ,如 图 10-27 一 图 10-29 所 示 , 其 中 学 号 是 学 生 实 体 的 主 码 , 工 号 是 教师 实体 的 主 
码 ,课程 号 是 课程 实体 的 主 码 。 


教师 


图 10-28 教师 实体 属性 图 


课程 


图 10-29 课程 实体 属性 图 


2. 设计 分 E-R 图 

在 该 系统 中 ,设计 3 个 实体 : 学 生 .教师 .课程 ,3 个 实体 之 间 均 存在 联系 。 

根据 需求 分 析 的 结果 可 以 得 到 ,在 学 生 选 课 系 统 中 ,一 个 学 生 可 以 选择 多 门 课程 ,一 个 
教师 也 可 以 教授 不 同 的 课程 ,一 门 课 可 以 被 多 个 学 生 选 修 , 同 时 也 可 以 被 多 个 教师 教授 。 由 
此 可 知 ,学 生 、 教 师 、 课 程 三 者 之 间 是 通过 选课 进行 联系 的 。 

。 学 生 与 教师 : 一 个 教师 可 以 教授 多 名 学 生 , 每 个 学 生 可 以 选修 多 个 教师 的 课程 。 所 
以 ,学 生 与 教师 之 间 是 通过 选课 进行 联系 的 ,并 且 二 者 之 间 的 关系 是 多 对 多 的 联系 。 
学 生 与 课程 : 一 个 学 生 可 以 选择 多 门 课程 ,一 门 课程 可 以 对 多 个 学 生 开放 。 因 此 ， 
学 生 与 课程 之 间 是 多 对 多 的 联系 ,学 生 选 修一 门 课程 会 有 一 个 成 绩 。 
教师 与 课程 : 一 个 教师 可 以 教授 多 门 课程 ,一 门 课程 同时 也 可 以 被 多 名 教师 教授 。 
因此 ,教师 与 课程 之 间 的 关系 是 多 对 多 的 联系 。 10 
根据 上 述 分 析 ,得 到 各 个 局 部 的 E-R 图 ,如 图 10-30 一 图 10-32 所 示 。 
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学 生 学 生 
m m 
教授 选课 
n n 


教师 课程 


图 10-30 ”学生 和 教师 之 间 的 E-R 图 图 10-31 学 生 和 课程 之 间 的 E-R 图 


3. 合并 分 E-R 图 ,生成 初步 E-R 图 

合并 分 E-R 图 并 不 是 单纯 地 将 各 个 分 E-R 图 画 在 一 起 ,而 是 必须 消除 各 个 分 E-R 图 中 
的 不 一 致 ,以 形成 一 个 能 为 全 系统 中 所 有 用 户 共同 理解 和 接受 的 统一 的 概念 模型 。 如 何 合 
理 消除 各 个 分 E-R 图 的 冲突 是 生成 初步 E-R 图 的 关键 所 在 。 各 个 分 E-R 图 之 间 的 冲突 包 
括 3 种 : 属性 冲突 、 命 名 冲突 和 结构 冲突 。 

经 过 分 析 ,学 生 ,教师 和 课程 三 者 之 间 可 以 通过 选课 这 个 联系 进行 关联 。 因 此 ,合并 上 
述 分 E-R 图 ,生成 学 生 选 课 系统 初步 E-R 图 ,如 图 10-33 所 示 。 


教师 
教师 


讲授 


图 10-32 ”教师 和 课程 之 间 的 E-R 图 图 10-33 学生 选 课 系 统 的 初步 E-R 图 


4. 全 局 E-R 图 
将 各 个 实体 的 属性 加 入 形成 全 局 E-R 图 ,如 图 10-34 所 示 。 


图 10-34 学 生 选 课 系 统 的 全 局 E-R 


数据 库 的 逻辑 结构 设计 是 根据 概念 结构 设计 的 全 局 E-R 图 ,按照 转换 规则 ,将 E-R 图 
转换 成 数据 模型 的 过 程 。 在 关系 数据 库 管理 系统 中 ,即将 实体 与 联系 转换 成 一 系列 的 关系 
模式 。 

在 E-R 图 中 ,实体 应 该 单独 转换 成 一 个 关系 模式 。 其 中 主 码 用 横 线 标 出 ,学 籍 信息 管 
理 系统 的 关系 模式 如 下 所 示 。 


10.3.4 逻辑 结构 设计 


逻辑 结构 设计 就 是 将 概念 结构 设计 中 的 全 局 E-R 图 转换 为 与 选用 的 DBMS 产品 所 支 
持 的 数据 模型 相符 合 的 逻辑 结构 。 

在 关系 数据 库 系 统 中 ,数据 库 的 逻辑 设计 就 是 根据 概念 模型 设计 的 E-R 图 ,按照 ER 
图 到 关系 数据 模型 的 转换 规则 ,将 E-R 图 转换 成 关系 模型 的 过 程 , 即 将 所 有 的 实体 和 联系 
转化 为 一 系列 的 关系 模式 的 过 程 。E-R 图 向 关系 模型 的 转换 要 解决 的 问题 是 ,如 何 将 实体 
和 实体 之 间 的 联系 转换 为 关系 模式 ,以 及 如 何 确定 这 些 关系 模式 的 属性 和 主 码 。 

根据 第 5 章 介绍 的 E-R 图 向 关系 数据 模型 转换 的 相关 规则 ,将 图 10-34 所 示 的 E-R 图 
转换 为 关系 数据 模型 ,得 到 学 生 选 课 系 统 的 关系 模式 如 下 : 

@ student( 学 号 ,姓名 ,性 别 ,专业 , 院 系 , 年 龄 ,电话 ,E-mail) 

@ teacher( 工 号 ,姓名 ,性 别 ,年 龄 , 院 系 ,职称 ,电话 ,E-mail) 

@ course( 课 程 号 ,课程 名 ,学 分 ) 

@ sc( 学 号 ,课程 号 , 工 号 ,成 绩 ) 

在 本 案例 中 “学 号 ”是 学 生 的 主 码 , 被 加 入 到 选课 关系 模式 中 ,在 选课 关系 中 ,“ 学 号 ”应 
该 设置 为 外 码 ,参照 学 生 中 的 主 码 “ 学 号 ”。 同 理 课 程 号 、 工 号 均 为 外 码 , 参 照 课程 关系 及 教 
师 关系 的 主 码 “ 课 程 号 ”及 “ 工 号 ”。 


10.3.5 数据 库 系统 物理 设计 与 实施 


在 本 案例 的 数据 库 的 实施 过 程 中 ,前 台 用 户 界面 的 设计 采用 Visual Studio. NET 2015 
作为 开发 的 主要 软件 ,而 后 台 的 数据 库 设计 采用 SQL Server 2014 关系 数据 库 管理 系统 。 

1. 建立 "学生 选课 系统 ”数据库 

首先 ,为 学 生 选 课 系 统 建立 数据 库 “* 学 生 选 课 系 统 ”, 建 立 数据 库 有 两 种 方式 : 
Management Studio 图 形 工具 交互 向 导 方 式 和 SQL 语句 方式 。 下 面 分别 使 用 这 两 种 方法 
建立 数据 库 。 

1) 交互 向 导 方 式 

(1) 首先 启动 SQL Server 2014 Management Studio。 依 次 单 击 *“ 开 始 ”- 所 有 程序 ”~ 
SQL Server 2014—>SQL Server 2014 Management Studio Express, 启 动 SQL Server 2014 
数据 库 管 理 系统 。 

(2) 登录 数据 库 服务 器 。 单 击 “ 连 接 到 服务 器 ”对 话 框 中 的 “连接 ”按钮 连接 到 SQL 
Server 2014 数据 库 服务 器 ,如 图 10-35 所 示 。 

(3) 创建 数据 库 “ 学 生 选 课 系 统 ”。 在 “对 象 资源 管理 器 ”中 右 击 数据 库 对 象 ,在 弹出 的 
快捷 菜单 中 , 单 击 “ 新 建 数 据 库 ” 命 令 。 在 “新 建 数据 库 ” 对 话 框 中 输入 数据 库 名 称 “ 学 生 选 课 
系统 ”, 设 置 好 后 , 单 击 “ 确 定 ” 按 钮 。 之 后 在 "对象 资 源 管理 器 "中, 右 击 “ 数 据 库 ”, 在 弹出 的 
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快捷 菜单 中 执行 “刷新 ”命令 ,执行 结果 如 图 10-36 所 示 。 


a 了 回 汪 
日 图 DESKTOP-CLO18FEWABC (SQL Server 12.0.2269 
日 向 数据 幸 
日 向 NR 库 
田 名 数据 库 快照 
a 连接 到 服务 器 田 国 ReportserverSABC 
田 国 ReportServer$ABCTempDB 
H 田 国 要 录 
Microsoft SQL Server 2014 i 
用 各 类 型 (D er 
服务 器 名 称 (8) 田 国 安全 性 
身份 给 证 (8); Windows 身份 验证 田 国 服务 器 对 象 
用 户 名 介 DESKTOP-CLD18PE\ 刘 刍 国 加 复制 
束 码 人) 田 国 AlwaysOn 高 可 用 性 
记 住 宣 友 名 昌国 管理 
回国 Integration Services 目录 
日 项 SQL server 代理 


取消 


图 10-35 数据 库 连接 对 话 框 图 10-36 ”创建 “学生 选课 系统 "对话 框 


2) 使 用 SQL 语句 方式 
还 有 另外 一 种 建立 数据 库 的 方法 , 即 SQL 语言 。 如 下 所 示 : 


CREATE DATABASE 学 生 选 课 系统 -- 创建 数据 库 

ON PRIMRRY 

NAME = ' 学 生 选 课 系统 _data' -- 主 数据 文件 的 逻辑 名 
FILENAME = 'D:\sq12014\ 学 生 选 课 系统 .mdf'， -- 主 数据 文件 的 物理 名 
SIZE = 10MB, 一 -初始 大 小 
FILEGROWTH = 10 % 一 -增长 率 

) 

LOG ON 

” 

NAME = ' 学 生 选 课 系 统 _log'， 一 -日 志文 件 的 逻辑 名 
FILENAME = 'D:\sq12014\ 学 生 选 课 系统 . 1df'， 一 -日 志文 件 的 物理 名 
SIZE = 1MB, 


MAXSIZE = 20MB, 
FILEGROWTH = 10 % 
) 


2. 建立 和 管理 基本 表 

经 过 以 上 分 析 , 需 要 为 该 系统 数据 库 建 立 四 张 基本 表 : 学 生 表 、 教 师表 ,课程 表 及 选课 
表 。 建 立 基本 表 的 方法 也 有 两 种 : 一 种 是 利用 SQL Server 2014 Management Studio 图 形 
工具 建立 基本 表 ; 还 有 一 种 就 是 利用 SQL 语句 在 查询 分 析 器 中 建 表 。 

以 下 介绍 利用 SQL 语句 在 查询 分 析 器 中 建 表 。 

(1) 启动 数据 库 并 连接 到 服务 器 。 打 开 SQL Server 2014, 在 弹出 的 “连接 到 服务 器 ”对 
话 框 单 击 “ 连 接 ” 按 钮 ,连接 到 数据 库 服 务 器 。 


(2) 新 建 表 SQL 脚本 。 单 击 工具 栏 的 “新 建 查询 ”。 输 入 SQL 语句 如 下 。 
学 生 表 : 


Create table student 

(学 号 char(10) primary key, 

姓名 char(20)， 

性 别 char(2) check( 性 别 in(' 男 ', ' 女 '))， 
专业 char(20)， 

院 系 char(20)， 

年 龄 smallint, 

电话 char(11)， 

Email char(20) 

); 

教师 表 : 

Create table teacher 

( 工 号 char(10) primary key, 

姓名 char(20)， 

性 别 char(2) check( 性 别 in(' 男 ', ' 女 '))， 
院 系 char(20)， 

年 龄 smallint, 

职称 char(10) check( 职 称 in( ' 教 授 ', ' 副 教授 ', ' 讲 师 '))， 
电话 char(15)， 

Email char(20) 

); 

课程 表 : 

Create table course 

(课程 号 char(10) primary key, 

课程 名 char(20)， 

学 分 char(2) 

); 

选课 表 : 

Create table sc 

(学 号 char(10)， 

课程 号 char(10)， 

工 号 char(10)， 

成 绩 char(3)， 

Primary key( 学 号 ,课程 号 , 工 号 )， 

Foreign key( 学 号 ) references student( 学 号 )， 
Foreign key( 课 程 号 ) references course( 课 程 号 )， 
Foreign key( 工 号 ) references teacher( 工 号 ) 
); 


编写 好 每 一 条 SQL 语句 后 , 单 击 工具 栏 中 的 “执行 ”按钮 ,运行 SQL 语句 ,完成 一 个 表 
(数据 库 ) 的 创建 。 右 击 左 侧 * 对 象 资源 管理 器 ”中 的 “ 表 ”, 单 击 “ 刷 新 ”命令 即 可 看 到 新 建 的 
学 生 表 。 按 照 此 步骤 依次 建立 四 张 表 。 建 好 的 表格 如 图 10-37 所 示 。 若 是 数据 库 则 右 击 左 
侧 “ 数 据 库 ”, 单 击 * 刷 新 ”命令 即 可 。 

图 10-38 为 上 述 的 SQL 脚本 新 建 的 学 生 基 本 表 。 

由 于 篇 幅 有 限 ,请 读者 参照 学 生 表 的 建立 过 程 , 完 成 学 生 选 课 系统 的 教师 .课程 和 选课 
等 基本 表 的 建立 。 这 里 不 再 费 述 。 下 面 附 上 每 个 表 的 属性 信息 列表 。 表 10-1 为 学 生 基 本 
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对 人 象 资源 管理 器 3 
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日 国 数据 过 
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国 国 系统 表 
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国 国 视图 

回国 同义词 
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图 10-37 数据 库 完 成 界面 


SQLQueny2.sql -…CLO18FE\ 刘 纵 (61D))”X 
BCreate table student 
(学 号 char (10) prinary key, 
姓名 char (20)， 
性 别 char (2) check (性 别 in( 男女" ))， 
夸 业 char (20)， 
院 系 char (20)， 
一 年 龄 smallint, 
相 电话 char (11)， 


田 国 Reports4 Enail char (20) 
田 @ 琶 
田 国 学 生 管理 
日 加 学 生 选 淋 
田 国 数据 
日 息 表 


10% ~ 
回 喜 DESKTOP-CLO18FEWABC (12.0 RTM) ，DESKTOP-CLO18FE\ 刘 雁 (61) 学生 选 浊 | 00:00:00 | 0 行 


10-38 CREATE TABLE 语句 创建 学 生 表 


表 的 属性 信息 ; 表 10-2 为 教师 基本 表 的 属性 信息 ; 表 10-3 为 课程 基本 表 的 属性 信息 ; 


表 10-4 为 学 生 选 课 基 本 表 的 属性 信息 。 
表 10-1 学 生 (student) 基 本 表 的 属性 信息 
属性 列 数据 类 型 是 否 为 空 / 约 东 条 件 
学 号 char(10) 主 码 
姓名 char(20) 否 
性 别 char(2) 风衣 
专业 char(20) 否 
院 系 char(20) 否 
年 龄 smallint 1 一 100 
电话 char(11) 否 
E-mail char(10) 否 
表 10-2 教师 (teacher) 基 本 表 的 属性 信息 
属性 数 据 类 型 是 否 为 空 / 约 东 条 件 
工 号 char(10) 主 码 
姓名 char(20) 否 
性 别 char(2) “三 
职称 char(20) 否 
院 系 char(20) 否 
年 龄 smallint 1~100 
电话 char(11) 否 
E-mail char(10) 否 
表 10-3 课程 (course) 基 本 表 的 属性 信息 
属性 数据 类 型 是 否 为 空 /约束 条 件 
课程 号 Char(10) 主 码 
课程 名 Char(20) 否 
学 分 Char(2) 1~10 
表 10-4 学生 选 课 (sc) 基 本 表 的 属性 信息 
属性 数据 类 型 是 否 为 空 /约束 条 件 
学 号 char(10) 否 
工 号 char(10) 否 
课程 号 char(10) 否 
成 绩 char(3) 允许 为 空 ,如 果 不 为 空 , 值 应 为 0 一 100 


注意 : 在 建立 sc 表 时 ,应 该 注意 分 别 为 选课 表 的 属性 “学 号 ”课程 号 ”和 “ 工 号 ”加 上 和 外 
码 约束 。 选 课表 的 这 3 个 属性 信息 是 分 别 来 源 于 student 表 、course 表 和 teacher 表 的 字 
段 , 如 果 没 有 student 表 中 的 “学 号 ”course 表 中 的 “课程 号 ”或 teacher 表 中 的 “ 工 号 ”属性 
值 ,那么 为 sc 表 添 加 数据 是 不 符合 逻辑 的 ,同时 也 违反 了 数据 的 参照 完整 性 约 东 条 件 。 利 
用 语句 “FOREIGN KEY( 属 性 名 ) REFERENCES 表 名 (属性 名 )? 建 立 外 码 约 束 。 
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3. 管理 基本 表 

随 着 应 用 环境 和 应 用 需求 的 改变 ,有 时 候 需要 修改 已 经 建立 好 的 基本 表 的 模式 结构 。 
SQL 语言 采用 ALTER TABLE 语句 修改 基本 表 结 构 ; 利用 DROP 子 句 删除 基本 表 ; 
ALTER TABLE 语句 可 以 修改 基本 表 的 名 字 、 增 加 新 列 或 者 增加 新 的 完整 性 约束 条 件 、 修 
改 原 有 列 的 定义 ,包括 修改 列 名 和 数据 类 型 等 ; DROP 字句 用 于 删除 指定 的 完整 性 约束 
条 件 。 

当然 ,也 可 以 利用 SQL server 2014 的 Management Studio 图 形 工 具 交 互 式 地 修改 基 
本 表 的 结构 。 下 面 以 学 生 表 为 例 , 进 行 一 些 基本 表 的 管理 操作 。 

【 例 1】 向 学 生 表 中 增加 “入 学 时 间 ” 属 性 列 , 其 数据 类 型 是 日 期 型 。 

解析 : 题目 要 求 向 已 经 存在 的 student 表 中 增加 一 列 “ 入 学 时 间 ”, 采 用 ALTER 
TABLE…ADD… 命 令 即 可 完成 操作 。 具 体 的 SQL 语句 如 下 : 

ALTER TABLE student ADD 人 学 时 间 DATETIME; 

同样 ,也 可 以 利用 Management Studio 图 形 工 具 交 互 式 地 向 student 表 中 添加 “入 学 时 
间 ” 列 ,具体 的 操作 步 又 如 下 。 

(1) 打开 SQL Server 2014, 在 “对 象 资源 管理 器 ”中 , 单 击 * 学 生 选 课 系统 ”数据 库 中 
日 目 和 迄 果 # 统 展开 , 右 击 student 表 , 单 击 “ 设 计 ” 命 令 , 如 图 10-39 所 示 。 
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< 列 名 数据 兴 型 允许 Null 值 
|B peskrop-ctolaFEwBc (saL SA © 3 char(10) 

3 ss A :*s 
四 各 系 培 数 笑 库 位 一 
电器 政 守 降 亿 吕 gy 

田园 Reportseversapc | Wn 

年 葵 
电 活 
email 
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日 国 学 生 选 课 系 统 
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日 固 雪 
田 各 系统 表 
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国 四 dbo.course vY 
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char(15) 
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图 10-39 “修改 "数据 表 结构 


(2) 在 最 后 一 行 对 应 的 列 名 输入 "和 人 学 时 间 ”, 数 据 结构 选择 datatime, “允许 空 ”选择 
“允许 ”, 即 ,如 图 10-40 所 示 。 

(3) 单 击 上 方 的 “保存 ”按钮 , 即 可 完成 向 student 表 中 添加 “入 学 时 间 ” 属 性 列 的 操作 。 

【 例 2】 将 student 表 中 的 “电话 ”属性 的 数据 类 型 改 为 字符 型 : VARCHAR(15)。 

解析 : 利用 SQL 语句 修改 字段 类 型 , 


ALTER TABLE student ALTER COLUMN 电话 VARCHAR(15); 
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图 10-40 添加 “入 学 时 间 ” 属 性 列 


具体 的 操作 步骤 如 下 。 
(1) 打开 SQL Server 2014, 单 击 “ 新 建 查询 ”, 输 入 上 述 SQL 语句 ,然后 单 击 执行 。 
(2) 右 击 student 表 , 单 击 “ 设 计 ” 命 令 , 如 图 10-41 所 示 , 即 可 完成 修改 “电话 ”属性 列 的 


晤 DESKTOP-CLO18FEWABC. 学 生 选 混 系 统 - dbo.student - Microsoft SQL Server Management Studio - OO x 


DESKTOP-CLO18F.-. 统 - dbo.student X e BFE 
列 各 数据 类 型 允许 Null 值 
char(10) 
char(20) 
char(2) 
char(20) 
char(20) 


tinyint 
varchar(15) 
varchar(50) 


国生 FileTables 
国 回 dbo.course datetime 
国 回 dboct 

国 四 dbo.manLogin 
国 国 dbosc 

国 器 dbo.student 
国 回 dbo.stuLogin 
国 加 dboteacher 


口 图 图 图 回回 加 图 口 口 


图 10-41 修改 “电话 ?属性 列 的 数据 类 型 
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4. 视图 的 建立 和 管理 

数据 库 中 的 视图 是 常用 的 数据 对 象 , 它 用 于 定义 数据 库 某 类 用 户 的 外 模式 。 通 过 创建 
视图 ,可 以 限制 不 同 的 用 户 查 看 不 同 的 信息 ,屏蔽 用 户 不 关心 的 或 者 不 应 该 看 到 的 信息 。 
视图 是 从 一 个 或 者 多 个 基本 表 中 导出 的 表 , 它 和 基本 表 不 同 ,视图 是 一 个 虚 表 ,其 数据 
不 单独 保存 在 一 个 基本 文件 中 ,仍然 保存 在 原来 的 基本 表 文 件 中 ,数据 库 系 统 中 只 保存 视图 
的 定义 。 视 图 一 经 定义 ,就 和 基本 表 一 样 ,也 是 关系 ,可 以 进行 基本 的 操作 ,如 查询 、 删 除 等 。 

在 SQL Server 2014 中 ,建立 视图 的 方法 有 两 种 : 一 种 是 利用 SQL 语句 建立 视图 ,一 种 
是 利用 Management Studio 工具 交互 式 的 对 象 资源 管理 器 方法 建立 视图 。 下 面 以 学 生 选 课 
系统 中 需要 建立 的 一 些 视图 为 例 进行 说 明 。 

【 例 3】 由 于 每 个 教师 所 教授 的 学 生 不 同 ,但 老师 不 能 管理 不 属于 他 班级 的 同学 ,为 方便 
各 个 教师 的 教学 管理 人 员 查 看 自己 所 教授 的 学 生 , 为 每 个 老师 分 别 建立 一 个 学 生 视图 。 

解析 : 下 面 针 对 这 个 视图 用 两 种 方法 进行 说 明 。 

第 一 种 方法 : 用 SQL 语句 建立 视图 。 

在 “新 建 查询 ”窗口 中 ,输入 创建 视图 的 SQL 语句 , 单 击 “ 执 行 "按钮 ,在 消息 提示 框 可 以 
看 到 提示 信息 “命令 已 成 功 完成 ”。 

CREATE VIEW view_ 周 一 冰 

ns 


SELECT student. * ,course. 课程 名 
FROM student, course, sc 


Where student. 学 号 = sc. 学 号 and course. 课程 号 = sc. 课 程 号 and sc. 工 号 = '2005002'; 


当 视图 建 好 之 后 ,就 可 以 像 操作 基本 表 一 样 查看 视图 : 在 “新 建 查询 ”窗口 中 ,输入 查询 
语句 查询 新 建 的 视图 ,这 个 视图 只 能 看 到 周一 冰 教 师 所 教授 的 学 生 的 信息 ,而 其 他 学 生 信息 
是 看 不 到 的 ,从 而 使 视图 能 够 对 机 密 数据 提供 安全 保护 , 即 限制 了 不 同 的 用 户 查看 信息 的 范 
围 。 使 用 下 面 的 SQL 语句 查询 视图 ,查询 视图 结果 如 图 10-42 所 示 。 
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NULL Nu NUL NUL NUL 


图 10-42 查看 周一 冰 教 师 所 教授 的 学 生 视图 结果 
查询 视图 SQL 语句 : 


SELECT x FROM view_ 周 一 冰 ; 


第 二 种 方法 : 利用 Management Studio 工具 交互 式 建立 视图 。 

打开 “对象 资 源 管理 器 ”, 找 到 “学生 选课 系统 ?数据库 , 单 击 昌国 和 找到 “视图 ”, 布 击 
“视图 ”, 在 菜单 中 单 击 “新 建 视图 ”。 在 弹出 的 对 话 框 中 先 单 击 student、sc、course, 然 后 单 击 
“添加 ?按钮 , 单 击 “关闭 ?按钮 ,将 所 有 的 列 选中 ,在 * 工 号 ”这 一 行 对 应 的 “筛选 器 ”这 一 行 中 
输入 “2005002”, 单 击 “ 确 定 ” 按 钮 ,如 图 10-43 所 示 。 

单 击 工具 栏 上 的 国 按 钮 ,将 视图 名 称 命名 为 “view_ 周一 冰 ”, 单 击 “ 确 定 ” 按 钮 ,在 左 侧 
的 “对 象 资源 管理 器 "中 右 击 “视图 ”, 在 弹出 的 快捷 菜单 中 单 击 “ 刷 新 ”命令 即 可 看 到 新 建 的 
视图 “view_ 周一 冰 ”。 

查看 新 建立 的 视图 中 的 信息 , 右 击 “view_ 周一 冰 ”, 单 击 * 打 开 视 图 ”, 在 右 侧 看 到 新 建 
立 的 视图 的 信息 ,如 图 10-43 所 示 。 


DESKTOP-CLO18F. 统 -dboView_2* x 


图 10-43 新建 视图 


由 于 篇 幅 有 限 , 其 他 教师 视图 的 建立 过 程 这 里 不 再 著述 .都 可 仿照 周一 冰 教 师 的 视图 的 
建立 方法 。 

5. 数据 查询 

数据 查询 是 数据 库 的 核心 操作 。SQL 提供 了 SELECT 语句 进行 数据 库 查询 ,该 语句 
具有 灵活 的 使 用 方式 和 功能 。 在 学 生 选 课 管理 系统 中 常用 的 查询 操作 主要 包括 : 学 生 查询 
自己 的 选课 信息 ,了 解 选择 了 哪些 课程 ; 教师 查询 自己 所 教授 的 课程 ,有 哪些 课程 以 及 所 教 
授课 程 的 成 绩 单 等 ; 下 面 针 对 常用 的 查询 操作 进行 举例 说 明 。 

【 例 4】 查询 学 号 为 “1501010101” 的 学 生 信 息 。 

解析 : 本 查询 只 涉及 student 表 , 是 一 个 简单 查询 。 查 询 语句 如 下 : 


Select * from student where 学 号 = '1501010101'; 


【 例 5】 查询 姓名 为 “ 马 三 强 ” 的 同学 的 信息 。 
解析 : 本 查询 只 涉及 student 表 , 是 一 个 简单 查询 。 查 询 语句 如 下 : 
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Select * from student where 姓名 = ' 马 三 强 '; 

【 例 6】 查询 周一 冰 教 师 所 教授 的 学 生 信 息 。 

解 : 本 查询 可 以 直接 利用 查询 视图 从 而 达到 此 条 件 查询 。 

Select * from view_ 周一 冰 ; 

【 例 7】 查询 “ 杨 雪 ”同学 的 选课 信息 。 

解 : 本 查询 需要 列 出 学 生 选课 的 具体 信息 ,包括 学 生 的 学 号 姓名、 课程 号 和 课程 名 等 ， 
要 实现 本 查询 ,需要 从 学 生 ,课程 和 选课 3 个 表 中 获取 信息 ,可 以 用 连接 查询 方法 实现 ,具体 
查询 语句 如 下 : 


SELECT student. 学 号 , student. 姓名 , sc. 课程 号 ,course. 课 程 名 
FROM student, course, sc 
where student. 学 号 = sc. 学 号 and sc. 课 程 号 = course. 课 程 号 and student. 姓 名 = ' 杨 雪 '; 


查询 结果 如 图 10-44 所 示 。 


由 SQLQuery5.sql - DESKTOP-CLO18FEWABC 学 生 迁 混 系 统 (DESKTOP-CLO18FEWI 挫 (- 一 口 Xx 


SQLQuery5.sql -CLO18FE\ (59)” x 
日 SELECT student. 学 号 , student. 姓名 , sc. 课程 号 , course. 课程 名 


FROM student, course, sc 

where student. 学 号 =sc. 学 号 
and sc, 课程 号 -course. es 
and student, 姓 名 = 


姓名 课程 号 ”课程 名 
[moioion | 杨 委 00! 。 高 等 教学 
1501010101 杨 雪 002 ”大 学 英语 
1501010101 杨 直 004 大 学 生 就 业 


图 10-44 杨 雪 同学 的 选课 信息 查询 结果 
【 例 8】 将 课程 名 为 “大学生 就 业 ” 的 学 分 修改 为 3 分 。 
解 : 将 课程 名 为 “大 学 生 就 业 ? 的 学 分 修改 为 3 分 ,也 就 相当 于 更 新 course 表 中 的 课程 
名 为 “大 学 生 就 业 ” 的 课程 记录 。 
UPDATE course 


SET 学 分 = '3' 
where 课程 名 = ' 大 学 生 就 业 '; 


由 于 篇 幅 有 限 ,数据 更 新 操作 这 里 就 不 过 多 举例 了 。 还 有 疑问 的 同学 可 以 复习 第 3 章 
的 相关 内 容 。 
6. 数据 库 维护 


数据 维护 包括 许多 内 容 , 包 括 用 户 权限 的 设置 .数据 库 完 整 性 维护 .数据库 的 备份 . 表 的 
备份 .日 志 备 份 等 。 这 里 只 介绍 数据 库 的 备份 。 


SQL Server 2014 提供 了 如 下 4 种 不 同 的 备份 方式 。 

1) 完整 备份 

备份 整个 数据 库 的 所 有 内 容 , 包 括 事务 日 志 。 该 备份 类 型 需要 比较 大 的 存储 空间 来 存 
储备 份 文 件 , 备 份 时 间 也 比较 长 ,在 还 原 数据 时 ,也 只 需要 一 个 备份 文件 。 

2) 差异 备份 

它 是 完整 备份 的 补充 ,差异 备份 只 备份 上 次 完整 备份 后 更 改 的 数据 。 相 对 完整 备份 来 
说 ,差异 备份 的 数据 量 比 完整 备份 的 数据 量 小 ,备份 的 速度 也 比 完 整备 份 的 速度 要 快 。 因 
此 ,数据 库 管 理 员 经 常 采用 的 是 一 次 完整 性 备份 后 再 还 原 最 后 一 次 所 做 的 差异 备份 ,这 样 才 
能 让 数据 库 中 的 数据 恢复 到 与 最 后 一 次 差异 备份 时 的 内 容 相同 。 

3) 事务 日 志 备 份 

事务 日 志 备份 只 备份 事务 日 志 里 的 内 容 。 事 务 日 志 记 录 了 上 一 次 完整 备份 或 事务 日 志 
备份 后 数据 库 的 所 有 变动 情况 。 因 此 在 做 事务 日 志 备 份 之 前 ,也 必须 要 做 一 次 完整 备份 。 
事务 日 志 备 份 在 还 原 数 据 时 ,除了 先 要 还 原 完整 备份 之 外 ,还 要 一 次 还 原 每 个 事务 日 志 
份 ,而 不 是 只 还 原 最 近 一 个 事务 日 志 备 份 。 

4) 数据 库 文件 和 文件 组 备份 

如 果 在 创建 数据 库 时 ,为 数据 库 创建 了 多 个 数据 库 文件 或 文件 组 ,可 以 使 用 该 备份 方 
式 。 使 用 文件 和 文件 组 备份 方式 可 以 只 备份 数据 库 中 的 某 些 文件 ,该 备份 方式 在 数据 库 文 
件 非常 庞大 的 时 候 十 分 有 效 ,由 于 每 次 只 备份 一 个 或 多 个 文件 或 文件 组 ,可 以 分 多 次 来 备份 
数据 库 , 避 免 大 型 数据 库 备份 的 时 间 过 长 。 另 外 ,由 于 文件 和 文件 组 备份 只 备份 其 中 一 个 或 
多 个 数据 文件 。 因 此 当 数 据 库 里 的 某 个 或 某 些 文件 损坏 时 ,可 以 只 还 原 损 坏 的 文件 或 文件 
组 备份 即 可 。 

在 创建 数据 库 备 份 之 前 必须 先 创 建 备份 设备 。“ 备 份 设备 ” 指 的 是 备份 或 还 原 操作 中 使 
用 的 磁带 机 或 磁盘 驱动 器 。 在 创建 备份 时 ,选择 要 将 数据 写 入 的 备份 设备 。Microsoft SQL 
Server 2014 可 以 将 数据 库 、 事 务 日 志和 文件 备份 到 磁盘 和 磁带 设备 上 。 

创建 备份 设备 和 备份 数据 库 有 两 种 方法 : 一 种 是 使 用 SQL 语句 备份 数据 库 ; 一 种 是 利 
用 Management Studio 工具 交互 式 备份 数据 库 。 

下 面 只 介绍 Management Studio 工具 交互 式 备份 数据 库 。 

1) 创建 备份 设备 

打开 “对 象 资源 管理 器 ”, 单 击 “ 服 务 器 对 象 ”, 右 击 “ 备 份 设备 ”, 再 单 击 “ 新 建 备份 设备 ”， 
在 打开 的 “备份 设备 ”窗口 中 ,输入 备份 设备 名 称 “ 学 生 选 课 系 统 _bak”,“ 文 件 ” 路 径 输 入 
“D:\BACKUPDB\ 学 生 选 课 系 统 _bakup”, 单 击 “ 确 定 ” 按 钮 即 可 在 左 侧 的 “对 象 资源 管理 
器 ”中 看 到 新 建 的 备份 文件 “学 生 选 课 系 统 _bak”。 

2) 备份 数据 库 

右 击 “学 生 选 课 系 统 ”, 在 操作 菜单 中 选择 “任务 ”。 接 着 ,在 任务 的 下 拉 选 项 中 单 击 “ 备 
份 ”, 然 后 选择 “备份 ”的 位 置 ,用 户 还 可 以 根据 自己 的 需要 对 数据 库 、 恢 复 模式 ,恢复 类 型 等 
进行 相应 的 设置 。 接 着 单 击 “ 添 加 ”按钮 ,然后 选择 备份 目标 。 最 后 单 击 确定 即 可 ,如 图 10-45 
所 示 。 


数据 库 设 计 实 钢 


履 据 亩 原理 及 应 用 教程 一 -SQL Server 2014 


选择 文件 或 备份 设备 作为 备份 目标 。 您 可 以 为 常用 文件 闻 姥 备份 设备 。 


碰 条 上 的 目标 


图 文件 名 加 ): 
DD: \sql2014\sal WISSQLI2 RSSQLVESSQLVBackwp\ 


衔 份 设备 (B) 


议 本 oe cinernnt 
二 各 4 国人 


图 10-45 数据 库 的 备份 


10.3.6 案例 的 应 用 程序 设计 


系统 主要 分 为 三 个 模块 ,分 别 为 学 生 模 块 .教师 模块 、 管 理 员 模 块 。 在 具体 介绍 每 个 模 
块 的 设计 之 前 ,首先 了 解 一 下 前 台 和 后 台数 据 库 的 连接 方式 。 

1. 前 台 开发 语言 和 后 台数 据 库 的 连接 方法 

1) C# 访 问 数据 库 的 方式 

由 于 本 系统 前 台 用 户 界面 的 开发 采用 的 是 C# 语 言 ,使 用 Visual Studio, NET 2015 作 
为 开发 平台 ,因此 本 系统 通过 C# 语 句 进 行 连接 。 因 为 数据 库 管理 系统 采用 的 是 SQL 
Server 2014, 所 有 连接 的 时 候 先 用 数据 库 连接 字符 串 ,建立 一 个 数据 库 连 接 类 : 
Connection, cs。 进 行 连 接 的 字符 串 语句 如 下 : 

Class Connection 

{ public static string myConnstring 

{get {return "Data Source = DESKTOP - CLO18FE \ ABC; Initial Catalog = 学 生 选 课 系 统 ; 

Integrated Security = True";} 

. } 

注意 : 

@ Data Source 或 Server 表示 数据 源 所 在 的 服务 器 名 ,也 可 以 写成 服务 器 的 IP 地 址 ， 
如 果 是 本 地 服务 器 可 以 有 以 下 几 种 写法 。 

。( 国 点 ) 


» (local) 

® 127.0.0,1 

。 本 地 服务 器 名 

@ Initial Catalog 表示 连接 的 数据 库 名 称 , 可 写 为 database。 

@ Integrated Security 表示 是 否 要 对 集成 身份 验证 。 

图 如 果 使 用 的 是 混合 验证 ,需要 对 用 户 名 user id 和 密码 password 字段 进行 验证 。 

上 面 的 几 点 是 用 本 地 连接 对 数据 库 进行 连接 的 ,在 连接 之 前 要 先 在 Connection. cs 文 
件 开头 处 添加 命名 空间 using System. data. sqlclient。 

2) 连接 字符 串 

Connection 对 象 最 重要 的 属性 是 连接 字符 串 myConnString, 这 也 是 Connection 对 象 
唯一 的 非 只 读 属性 ,用 于 提供 登录 数据 库 和 指向 特定 数据 库 所 需 的 信息 ,格式 如 下 : 

Connectionstring = @"Data Source = DESKTOP - CLO18FE\ABC; Initial Catalog = 学 生 选 课 系统 ; 

Integrated Security = True"; 

Data Source 指定 服务 器 名 ,Initial Catalog 指定 数据 库 名 字 , Integrated Security 指明 
访问 它 的 安全 机 制 。 

3) 创建 并 使 用 连接 对 象 

在 定义 了 连接 字符 串 之 后 , 即 可 进行 连接 ,要 先 加 载 头 文件 using System. data. 
sqlclient。 


SqlConnection conn = NEW SqlConnection(mystr); 


连接 数据 库 的 两 个 主要 方法 是 open() 和 close() 。Open 方法 使 用 mystr 属性 中 的 信息 
联系 数据 源 ,并 建立 一 个 打开 连接 。 而 close 方法 是 关闭 已 打开 的 连接 。 

2. 登录 界面 设计 i 

登录 界面 通过 radiobutton 来 选择 不 同 用 户 的 登 
录 模 式 ,整体 界面 的 框图 如 图 10-46 所 示 。 下 部 最 庆 学 大分 球 条 具 

添加 登录 页 面 代 码 : 

打开 当前 工程 , 转 到 代码 窗口 ,首先 需要 包含 如 下 
命名 空间 。 


using Systenm. Data. SqlClient; 


然后 进行 如 下 定义 : 
int intFalg = 0; 
SqlConnection conn; 10-46 ”登录 界面 设计 


SqlCommand comm; 
完成 上 述 操作 后 ,双击 登录 按钮 ,添加 如 下 代码 。 
Private void buttonLogin Click(object sender, EventArgs e) 


{ 
string mysql = ""; 
string mystr = @"Data Source = DESKTOP — CLO18FE\ABC; Initial Catalog = 学 生 选 课 系 统 ; 
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Integrated Security = True" 
conn = newSqlConnection(mystr) 


conn. Open() 
if (radioButtonStul. Checked) 
{ 
mysql = "select * from stuLogin where 用 户 名 = '" + textBoxID. Text 
+ "and 密码 = '" + textBoxPwd. Text + "'"; 
} 
if(radioButtonTeal. Checked) 
{ 
mysql = "select * from teaLogin where 用 户 名 = '" + textBoxID. Text 
+ "and 密码 = '" + textBoxPwd. Text + "'"; 
} 
if (radioButtonMan1. Checked) 
{ 
mysql = "select x* from manLogin where 用 户 名 = '” + textBoxID. Text 
+ "and 密码 = '”+ textBoxPwd.Text + "'"; 
} 


comm = newSqlCommand(mysql, conn); 
SqlDataReader dr = comm. ExecuteReader(); 
if (dr. HasRows) 
‘ 
intFalg = 1; 
} 
if (intFalg > 0) 
{ 
MessageBox. Show( "登录 成 功 !"); 
if (radioButtonStul.Checked) 


{ 
Formstu fo = newFormstu(textBoxID. Text); 
fo. ShowDialog( ); 

} 

if (radioButtonTeal. Checked) 

{ 
FormTea fo = newFormTea(textBoxID. Text); 
fo. ShowDialog( ); 

} 

if (radioButtonManl.Checked) 

二 
FormMan fo = newFormMan(); 
fo. ShowDialog(); 

} 

} 

else 

{ 

MessageBox. Show(" 登 录 失 败 !"); 

} 


} 
双击 退出 按钮 添加 如 下 代码 。 


private void button2 Click(object sender, EventArgs e) 


{ 
Application. Exit( ); 


} 
3. 管理 员 登 录 窗 体 设计 
管理 员 登 录 后 可 以 对 学 生 ,教师 .课程 信息 进行 查询 、 增 加 、 删 除 和 修改 等 操作 ,程序 运 
行 界面 如 图 10-47 所 示 。 


赐 管理 员 = 口 X 
学 生 信息 管理 教师 信息 管理 。 课程 管理 


图 10-47 管理 员 登 录 界面 


添加 和 修改 学 生 / 教 师 信息 。 


privatevoid buttonStuInf_Click(object sender, EventArgs e) 
{ 
if (comboBox1. Text != "") 
{ 
string mystr = @"Data Source = DESKTOP — CLO18FE\ABC; Initial Catalog = 
学 生 选 课 系 统 ;Integrated Security = True"; 
conn = newSqlConnection(mystr); 
conn. Open( ); 

if (intFlag == 1) 

{ 
mysql = "insert into student values('" + textBoxl.Text + 
"vv + textBox2.Text + "','" + comboBoxl.Text + "','" + 
textBox4. Text + "','" + textBox5.Text + "','" + 

textBox6. Text + "','" + textBox7.Text + "','" + 
textBox8. Text + "')"; 

} 

if (intFlag == 2) 

{ 
mysql = "insert into teacher values('” + textBox1.Text + 

"','™ + textBox2.Text + "','" + comboBoxl.Text + "','" + 
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textBox5. Text + "','" + textBox4.Text + "','" + 
ComboBox2. Text + "','" + textBox7.Text + "','" + 
textBox8. Text + "')"; 

} 
if (intFlag 
{ 


3) 


mysql = "update student set 姓名 ='" + textBox2.Text + "', 

性 别 ='" + comboBox1.Text + "', 专 业 ='" + textBox4.Text + "', 

院 系 = '”+ textBox5.Text + "', 年 龄 ='" + textBox6.Text + 

电话 ='" + textBox7.Text + "',email='" + textBox8.Text + 
"'where 学 号 = '" + comboBox3.Text + "'"; 


} 
if (intFlag == 4) 
{ 
mysql = "update teacher set 姓名 ='" + textBox2.Text + "', 
性 别 ='"” + comboBoxl.Text + "', 院 系 ='" + textBox4.Text + "', 
" + textBox5.Text + "', 职 称 ='" + comboBox2. Text + "', 
='" + textBox7. Text + "',email='" + textBox8.Text + 
"'where 工 号 = '”+ comboBox3.Text + "" 


try 
{ 
comm = newSqlCommand(mysql, conn); 
int i = comm. ExecuteNonQuery(); 
if (i>0) 
{MessageBox. Show( "成功 !"); } 
else 


{MessageBox. Show(" 失 败 !");} 
} 
catch (Exception ex) 
{MessageBox. Show( ex. ToString( ) );} 
finally 
{ 
groupBox1l. Visible = false; 
intFlag = 0; 
conn. Close(); 


else 
MessageBox. Show(" 主 码 不 能 为 空 !"); 
} 
查询 学 生 信息 : 


Private void 查询 学 生 信息 ToolStripMenuItem Click(object sender, EventArgs e) 
{ 
buttonDel. Visible = false; 
groupBoxl1. Visible = false; 
groupBox2. Visible = false; 
groupBox3. Visible = true; 
label12. Text =" 按 年 级 查询 "; 
label13. Text =" 按 专业 查询 "; 


string mystr = @"Data Source = DESKTOP -- CLO18FE\ABC; Initial Catalog = 
学 生 选 课 系统 ;Integrated Security = True"; 
conn = newSqlConnection(mystr); 
conn. Open(); 
try 
{ 
mysql = "select distinct substring(student. 学 号 ,1,2) from student"; 
comm = newSqlCommand(mysql, conn); 
SqlDataReader mydr = comm. ExecuteReader(); 
comboBox4. Items. Clear( ); 
while (mydr. Read()) 
{ 
comboBox4. Items. Add(mydr[0].ToString( )); 


mydr. Close( ); 
string mysqll = "select distinct 专业 from student "; 
comm = newSqlCommand(mysqll, conn); 
SqlDataReader mydrl = comm.ExecuteReader(); 
comboBox5. Items. Clear( ); 
while (mydr1. Read()) 
{ 
comboBox5. Items. Add(mydr1[ 0]. ToString( )); 
} 
mydr1. Close(); 
} 
catch( Exception ex) 
{ MessageBox. Show(ex.ToString()); } 
finally 
{ conn.Close(); intFlag = 1; } 
} 


课程 信息 管理 ,包括 简易 的 增删 改 查 ,如 图 10-48 所 示 。 


图 10-48 课程 信息 管理 
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private void 添加 学 生 账 号 ToolStripMenuItem Click(object sender, EventArgs e) 


{ 
buttonDel.Visible = false; 
groupBox1l. Visible = false; 
groupBox2. Visible = true; 
groupBox3. Visible = false; 
intFlag = 1; 

} 


private void 添加 教师 账号 ToolStripMenuItem Click(object sender, EventArgs e) 
{ 
buttonDel. Visible = false; 
groupBox!1. Visible = false; 
groupBox2. Visible = true; 
groupBox3. Visible = false; 
intFlag = 2; 


privatevoid button1l_Click(object sender, EventArgs e) 
{ 


string mystr = @"Data Source = DESKTOP — CLO18FE\ABC; Initial Catalog = 学 生 选 


课 系 统 ;Integrated Security= True"; 
conn = newSqlConnection(mystr); 
conn. Open( ); 
if (textBoxUser. Text != "") 
{ 
if (intFlag == 1) 
{ 
mysql = "insert into stuLogin values('" + textBoxUser.Text + "','" + 

textBoxPwd. Text + "')"; 


} 
if (intFlag == 2) 
{ 
mysql = "insert into teaLogin values('" + textBoxUser.Text + "','" + 
textBoxPwd. Text + "')"; 
} 
try 
{ 


comm = newSqlCommand(mysql, conn); 
if (comm. ExecuteNonQuery() > 0) 
{MessageBox. Show(" 添 加 成 功 !");} 
else 
{MessageBox. Show(" 添 加 失败 !1");} 
} 
catch (Exception ex) 
{ 
MessageBox. Show( ex. ToString()); 
} 
finally 
{ 
groupBox2. Visible = false; 


intFlag = 0; 


conn. Close( ); 


MessageBox. Show(" 主 码 不 能 为 空 !"); 


} 


private void 修改 学 生 信 息 ToolStripMenuItem_Click(object sender, EventArgs e) 


{ 


buttonDel. Visible = false; 
clear(); 
groupBox1l. Visible true; 
comboBox3. Visible = true; 
textBoxl. Visible = false; 
comboBox2. Visible = false; 
textBox6. Visible = true; 
groupBox3. Visible = false; 
labell.Text = 
label2.Text = 
label3.Text = 
label4.Text = 
label5. Text = 
label6. Text = 
label7. Text = 
label8. Text = "email:"; 

String mystr = (@"Data Source = DESKTOP — CLO18FE\ABC; Initial Catalog = 

学 生 选 课 系 统 ;Integrated Security = True"; 
conn = newSqlConnection(mystr); 
conn. Open( ); 

try 
{ 


mysql = "select 学 号 from student"; 
comm = newSqlCommand(mysql, conn); 
SqlDataReader mydr = comm.ExecuteReader(); 
comboBox3. Items. Clear( ); 
while (mydr. Read( )) 


{ 
comboBox3. Items. Add(mydr[ 0]. Tostring( )); 
} 
buttonStuInf. Text = "确定 修改 "; 
intFlag = 3; 


} 
catch(Exception ex) 


{ 

MessageBox. Show( ex. ToString( )); 
} 第 
finally 10 
{ 
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} 


conn. Close( ); 


Private void 修改 教师 信息 ToolStripMenuItem Click(object sender, EventArgs e) 


{ 


DataSet myds = newDataSet(); 
clear(); 

buttonDel. Visible = false; 
groupBox3. Visible = false; 
comboBox3. Visible = true; 
textBox1.Visible = false; 


groupBox1l.Visible = true; 
comboBox2. Visible = true; 
textBox6. Visible = false; 
labell. Text = " 工 号 :"; 
label2. Text = "姓名 
label3. Text = "性 别 
label4.Text = "年龄 :"; 
label5.Text = " 院 系 :"; 
label16. Text = "职称 :" 
label7.Text =“" 电 话 :"; 
label8. Text = "email:"; 
string mystr = @"Data Source = DESKTOP — CLO18FE\ABC; Initial Catalog = 
学 生 选 课 系统 ;Integrated Security= True"; 
conn = newSqlConnection(mystr); 
conn. Open( ); 
try 
{ 


mysql = "select 工 号 from teacher"; 
comm = newSqlCommand(mysql, conn); 
myda = newSqlDataAdapter(mysql, conn); 
myda. Fill(myds, "tea"); 
SqlDataReader mydr = comm.ExecuteReader(); 
comboBox3. Items. Clear( ); 
while (mydr. Read( )) 


comboBox3. Items. Add(mydr[ 0]. Tostring( )); 
} 
buttonStuInf. Text = "确定 修改 "; 
intFlag = 4; 
catch (Exception ex) 


MessageBox. Show( ex. ToString( )); 


finally 


conn. Close( ); 


} 


private void comboBox3_SelectedIndexChanged( object sender, EventArgs e) 
{ 

DataSet myds = newDataSet(); 
string mystr = @"Data Source = DESKTOP — CLO18FE\ABC; Initial Catalog = 
学 生 选 课 系统 ;Integrated Security= True”"; 

conn = newSqlConnection(mystr); 

conn. Open( ); 
if(intFlag == 3) 


mysql = "select * from student where 学 号 = '" + comboBox3.Text + "'"; 
} 
if(intFlag == 4) 
{ 
mysql = "select * from teacher where 工 号 ='" + comboBox3.Text + "'"; 


comm = newSqlCommand(mysql, conn); 
myda = newSqlDataAdapter(mysql, conn); 
myda. Fill(myds); 
for(int i=0;i<myds.Tables[0].Rows.Count;i++){ 
DataRow mydr = myds.Tables[0].Rows[i]; 
textBox2. Text = mydr[1].ToString(); 
comboBox1. Text = mydr[2].ToString(); 
textBox4. Text = mydr[3].ToString(); 
textBox5. Text mydr[4]. Tostring(); 
textBox6. Text mydr[5].ToString(); 
comboBox2. Text = mydr[5].ToString(); 
textBox7. Text = mydr[6].ToString(); 
textBox8. Text = mydr[7].ToString(); 


} 
catch( Exception ex) 
{MessageBox. Show( ex. Tostring( ));} 
finally{ 
myds. Clear(); 


conn. Close(); 


》 


4. 学 生 登 录 窗 体 设 计 
学 生 登 录 的 设计 ,是 为 了 方便 学 生 管理 自己 的 账户 信息 , 即 查看 、 修 改 个 人 信息 。 程 序 
运行 界面 如 图 10-49 所 示 。 
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| 
个 人 信息 。 信息 查询 ”网 上 选 归 。 修改 密码 
个 人 信息 
学 号 : 院 系 : 
姓名 : 年 齿 
性 别 v] 电话 
专业 : il: 
确定 
1abeli0 
fe 
用 户 名 : 
密码 : 确定 
再 人 输入 密码 : ] 取消 


图 10-49 学 生 登 录 窗 体 
下 面 主要 介绍 学 生 查 看 个 人 信息 的 方法 ,双击 菜单 栏 中 的 “个 人 信息 ”添加 如 下 代码 。 


privatevoid ShowInformation() 
{ 
string mystr = @"Data Source = DESKTOP - CLO18FE\ABC; Initial Catalog = 
学 生 选 课 系统 ;Integrated Security= True”"; 
conn = newSqlConnection(mystr); 
conn. Open( ); 
DataSet myds = newDataSet(); 


mysql = "select * from student where 学 号 ='" + textBoxSno. Text + "'"; 

comm = newSqlCommand(mysql, conn); 

myda = newSqlDataAdapter(mysql, conn); 

myda. Fill (myds, "StuInf"); 

mydt = myds.Tables["StuInf"]; 

for(int i=0;i<mydt.Rows.Count;i++) 

{ 
DataRow dr = mydt.Rows[i]; 
textBoxSname. Text = dr[1].ToString(); 
comboBoxSsex. Text = dr[2].ToString(); 
textBoxSmajor. Text = dr[3].ToString(); 
textBoxSdept. Text = dr[4].ToString(); 
textBoxSage. Text = dr[5].ToString(); 
textBoxStel. Text = dr[6].ToString(); 
textBoxSemail. Text = dr[7].ToString(); 


} 


privatevoid Formstu_Load(object sender, EventArgs e) 
{ 
buttonSure. Visible = false; 
ShowInformation( ); 
label10. Text = "欢迎 你 , ”+ textBoxSno. Text + "" + textBoxSname.Text + ""; 


comboBoxSelect. Text = "课程 号 "; 
buttonLesson. Visible = false; 
groupBox4. Visible = false; 
} 
privatevoid 选课 () 
{ 
DataSet myds = newDataSet(); 
string mystr = (@"Data Source = DESKTOP — CLO18FE\ABC; Initial Catalog = 
学 生 选 课 系 统 ;Integrated Security = True" 
conn = newSqlConnection(mystr); 
conn. Open( ); 
buttonLesson. Visible = true; 
buttonLesson. Text = "确认 选课 "; 
try 


mysql = "select course. 课程 号 ,course. 课程 名 ,course. 学 分 from 
course where course. 课程 名 not in (select course. 课程 名 from 
Course, sc where sc. 学 号 = '" + textBoxSno. Text + "'and course. 课 
程 号 = sc. 课程 号 ) "; 

comm = newSqlCommand(mysql, conn); 

myda = newSqlDataAdapter(mysql, conn); 

myda. Fill(myds); 

dataGridView1.DataSource = myds.Tables[0]; 

dataGridViewl. Show( ); 


} 
catch (Exception ex) 


' 
MessageBox. Show( ex. ToSstring( )); 


finally 


intFlag = 2; 
conn. Close( ); 


} 
privatevoid 选课 ToolStripMenuItem Click(object sender, EventArgs e) 
{ 
选课 (); 


privatevoid 退 选 () 
{ 

DataSet myds = newDataSet(); 
string mystr = @@"Data Source = DESKTOP — CLO18FE\ABC; Initial Catalog = 
学 生 选 课 系 统 ;Integrated Security = True"; 

conn = newSqlConnection(mystr); 

conn. Open( ); 

buttonLesson. Visible = true; 

buttonLesson. Text = "确认 退 选 "; 
try 
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{ 

mysql = "select course. 课程 号 ,course. 课程 名 ,course. 学 分 from 
course, sc where sc. 学 号 = '"” + textBoxSno. Text + "'and sc. 课 程 号 
= course. 课程 号 and 成 绩 is nu11"; 

comm = newSsqlCommand(mysql, conn); 

myda = newSqlDataAdapter(mysql, conn); 

myda. Fill(myds); 

dataGridView1.DataSource = myds.Tables[0]; 

dataGridView1. Show( ); 


catch (Exception ex) 
MessageBox. Show(ex. ToString( ) ); 
finally 


intFlag = 3; 
conn. Close( ); 
} 
} 
privatevoid 退 选 ToolStripMenuItem_Click(object sender, EventArgs e) 
{ 
退 选 (); 
} 
5. 教师 信息 管理 
教师 管理 几乎 与 学 生 管 理 类 似 ,这 里 不 再 过 多 描述 ,只 描述 教师 为 自己 所 教授 的 学 生 分 
配 成 绩 此 模块 ,如 图 10-50 所 示 。 


最 摘 历 - OO x 
个 人 信息 。 成 二 管理 。 坦 询 教学 去 排 ”修改 密码 欢迎 您 , 2005002 国 一 小 


图 10-50 教师 管理 界面 


双击 菜单 栏 中 的 “成 绩 管理 ”, 编 辑 代码 如 下 : 


private void 按 专 业 登 记 ToolStripMenuItem_Click(object sender, EventArgs e) 
{ 
CellClick = 1; 
groupBox2. Visible = true; 
groupBox2. Text = "查询 学 生 "; 
string mystr = (@"Data Source = DESKTOP — CLO18FE\ABC; Initial Catalog = 
学 生 选 课 系 统 ;Integrated Security = True"; 
conn = newSqlConnection(mystr); 
conn. Open( ); 
mysql = "select distinct 专业 from view " + labelll.Text + ""; 
comm = newSqlCommand(mysql, conn); 
SqlDataReader mydr = comm. FxecuteReader(); 
ComboBox1. Items. Clear( ); 
while (mydr. Read( )) 
{ 
comboBox1. Items. Add( mydr[0].ToString()); 
} 
mydr. Close( ); 
string mysqll = "select distinct 课程 号 from sc where 工 号 ='" + 
textBoxTno. Text + "'™"; 
comm = newSqlCommand(mysqll, conn); 
SqlDataReader mydrl = comm.ExecuteReader(); 
comboBox2. Items. Clear( ); 
while (mydr1. Read( )) 
{ 
comboBox2. Items. Add(mydr1[0]. ToSstring( )); 
} 
conn. Close(); 
} 
private void buttonSelectStu Click(object sender, EventArgs e) 
{ 
DataSet myds = newDataSet(); 
string mystr = @"Data Source = DESKTOP — CLO18FE\ABC; Initial Catalog = 
学 生 选 课 系 统 ;Integrated Security = True”"; 
conn = newSqlConnection(mystr); 
conn. Open( ); 
if(groupBox2. Text == "查询 学 生 ") 
mysql = "select distinct view_" + labelll.Text + ". 学 号 ,姓名 ,sc. 
课程 号 , course. 课程 名 , 性别, 专业 , 院 系 ,年 龄 ,电话 ,email from 
view_" + labelll.Text + ",sc,course where 专业 ='" + 
comboBox1. Text + "'and sc. 学 号 = view_" + label11. Text + ". 学 号 and 
sc. 课 程 号 = course. 课程 号 and sc. 课程 号 = '" + comboBox2. Text + "'"; 


if (groupBox2. Text == "查询 成 绩 ") 
mysql = "select distinct view_ ”+ labelll.Text + ". 学 号 ,view_" 
+ labell1.Text + ". 姓 名 ,course. 课 程 名 ,成 绩 from view_" + 
labelll.Text + ",sc,course where view_ ”+ labelll.Text + ". 学 
号 = sc. 学 号 and sc. 课程 号 = course. 课程 号 and course. 课程 号 
= '" + comboBox2.Text + "'and 成 绩 is not nul11"; 
Comm newSqlCommand(mysql, conn); 第 
myda = newSqlDataAdapter(mysql, conn); 10 
myda. Fill(myds); 


上 
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dataGridView1. DataSource = myds.Tables[0]; 
dataGridView1. Show( ); 
conn. Close( ); 
) 
private void dataGridViewl CellClick(object sender, DataGridViewCellEventArgs e) 
1 
DataSet myds = newDataSet(); 
groupBox3. Visible = true; 
textBoxSno. Enabled = false; 
textBoxSname. Enabled = false; 
if (CellClick == 1) 
{ 
string mystr = @"Data Source = DESKTOP — CLO18FE\ABC; Initial 
Catalog = 学 生 选 课 系 统 ; Integrated Security= True"; 
conn = newSqlConnection(mystr) 
conn. Open( ); 
证 (e.RowIndex < dataGridViewl. RowCount — 1) 
{ 


textBoxSname. Text = comm.ExecuteScalar().ToString(); 
string mysqll = "select distinct 课程 号 from sc,view_" + 
labell1. Text + " where view_" + labelll.Text + ". 学 号 = sc. 学 号 and 
sc. 学 号 = '” + textBoxSno. Text + " 
comm = newSqlCommand(mysqll, conn); 
myda = newSqlDataAdapter(mysqll, conn); 
SqlDataReader mydr = comm.ExecuteReader(); 
comboBoxCno. Items. Clear( ); 
while (mydr. Read()) 
{ 
comboBoxCno. Items. Add( mydr[ 0]. ToString( )); 
} 


conn. Close( ); 


} 


6. 程序 运行 演示 
如 图 10-51 所 示 为 学 生 查 询 已 选课 程 信息 。 


异 学 生 二 
个 人 信息 。 信息 查询 。 网 上 选 淋 修改 室友 
个 人 信息 
学 号 : [e0010l 这 系 : 和 子 信息 工程 学院 。 [ 台 各 ~ 二 
装 名 | 马 强 生病 : 习 
性 别 : 男 电话 : “|15500000002 
赤 业 :通信 专业 enail: nsqe163. com 


欢迎 你 , 1503010101 马 三 强 


图 10-51 学 生 查询 已 选课 程 信息 


图 10-52 所 示 为 教师 分 配 学 生成 绩 信息 。 


国教 5 

i = 学 安排 。 修改 守 码 欢迎 您 ,2005002 
开本 号 了 = 二 光学 生 
二 二: 风机 专业 : [ 芭 信 专 站 
性 别 : 男 电话 : 。 15100000032 加 


院 系 : ”电子 信息 工程 学 院 


图 10-52 教师 分 配 学 生成 绩 信 息 
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